العمل مع PDF/A أو PDF/UA
يفرض تنسيق PDF/A وPDF/UA العديد من المتطلبات المتعلقة بمحتوى المستند والتي لا يمكن تلبيتها أثناء التحويل التلقائي من مستند بتنسيق Word إلى PDF. يجب التحقق من هذه المتطلبات وتصحيحها إما في مستند Word قبل التحويل أو في مستند PDF بعد التحويل من أجل إنتاج مستند متوافق تمامًا مع PDF/A وPDF/UA.
المتطلبات الأساسية تتعلق ببنية أو خطوط مستند PDF/A وPDF/UA، والتي سنأخذها في الاعتبار في الأقسام التالية.
متطلبات هيكل الوثيقة
المتطلبات الحالية هي لتنسيقات PDF/A-1a، وPDF/A-2a، وPDF/A-4، وPDF/UA-1.
هناك بعض الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF المختلفة. يجب أن تؤخذ بعين الاعتبار إذا كنت ترغب في الحصول على النتيجة المتوقعة.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
من غير المستحسن للكتاب توليد معلومات هيكلية أو دلالية باستخدام العمليات الآلية دون التحقق المناسب.
ISO 19005-2، 6.7.1
تصف الأقسام الفرعية أدناه الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF المختلفة وخيارات الحلول الخاصة بها.
نوع الهيكل
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
مستند PDF عبارة عن سلسلة من الكتل مثل العناوين والفقرات والجداول وغيرها. تشكل هذه الكتل بنية مستندية - قوية أو ضعيفة.
كل من الهياكل القوية والضعيفة صالحة لـ PDF/A. تتميز مستندات Microsoft Word ببنية ضعيفة حسب التصميم، ويقوم Aspose.Words بإنشاء PDF ببنية ضعيفة على التوالي، كما يقوم أيضًا بإنشاء عناوين وفقًا لمستويات الخطوط العريضة للفقرات في المستند المصدر.
بالنسبة لمستند PDF/UA-1 ذي البنية الضعيفة، يلزم بالإضافة إلى ذلك أن تكون أرقام العناوين مرتبة دون فجوات.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
قد يتبع الهيكل على مستوى الكتلة أحد النموذجين الرئيسيين:
ISO-32000-1، 14.8.4.3.5
بالنسبة لمستندات PDF/UA-1، تحتوي المواصفات على إضافة تتعلق بمستويات العناوين (قم بالتوسيع لرؤية التفاصيل):
إذا كانت دلالات المستند تتطلب تسلسلًا تنازليًا للعناوين، فيجب أن يتم هذا التسلسل بترتيب رقمي صارم ويجب ألا يتخطى مستوى العناوين المتداخل. H1 H2 H3 مسموح به، بينما H1 H3 غير مسموح به.
ISO-14289-1، 7.4.2
لضمان الإخراج الصحيح، يتعين على المستخدمين التأكد من تنظيم محتوى المستند المصدر بشكل صحيح وتحديد مستويات المخطط التفصيلي للفقرات بشكل صحيح. بخلاف ذلك، يجب على المستخدم التحقق من بنية مستند PDF الناتج وإصلاحه.
في هذه المجموعة، يمكنك رؤية أمثلة: كيفية تعيين مستويات المخطط التفصيلي في Microsoft Word أو التحقق من بنية مستند PDF الناتج وإصلاحه (قم بالتوسيع لرؤية التفاصيل).
في Microsoft Word، يمكن استخدام أنماط "العنوان X" الافتراضية لتعيين مستوى المخطط التفصيلي:
بالإضافة إلى ذلك، يمكن التحقق من مستوى المخطط التفصيلي أو تغييره في نافذة "الفقرة":
في Acrobat، يمكن التحقق من بنية المستند أو تغييرها في جزء "العلامات":
وضع علامة على المحتوى باعتباره قطعة أثرية
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
في الوقت الحالي، يقوم Aspose.Words بوضع علامة على رؤوس الصفحات وتذييلاتها، وفواصل الملاحظات، وخلايا رأس الجدول المتكررة، والصور المزخرفة على أنها قطع أثرية. لاحظ أنه قد يتم تحديث هذه القائمة في المستقبل.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يمكن تقسيم الكائنات الرسومية الموجودة في المستند إلى فئتين:
ISO-32000-1، 14.8.2.2.1
إذا كان المستند يحتوي على أي محتوى آخر يجب وضع علامة عليه على أنه قطعة أثرية، أو إذا كان أي من المحتوى المصنوع محتوى حقيقيًا، فيجب على العملاء إصلاح ذلك في ملف PDF الناتج.
في هذه المجموعة، يمكنك رؤية أمثلة: كيفية وضع علامة على الأشكال على أنها مزخرفة في Microsoft Word أو وضع علامة على الشكل على أنه قطعة أثرية في مستند PDF الناتج (قم بالتوسيع لرؤية التفاصيل).
على سبيل المثال، يمكن وضع علامة على الأشكال على أنها مزخرفة في Microsoft Word، بحيث سيتم تصديرها إلى PDF كقطعة أثرية:
يمكنك وضع علامة على الشكل باعتباره قطعة أثرية في ملف PDF الناتج:
يمكنك أيضًا تبديل النص في الرأس من العنصر إلى المحتوى الحقيقي في ملف PDF الناتج:
مواصفات اللغة الطبيعية
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
يتم تحديد لغة النص في مستندات Microsoft Word. يقوم Aspose.Words بتصدير اللغة المحددة إلى ملف PDF الناتج مع سمة Lang المرفقة بتسلسل محتوى محدد أو علامة Span - ويتم التحكم فيها بواسطة خاصية ExportLanguageToSpanTag. بشكل عام، لا توجد مشكلات لغوية عندما يقوم المستخدم بإدخال النص عبر Microsoft Word. ولكن هناك احتمال أن تكون اللغة غير دقيقة إذا تم إنشاء النص تلقائيًا.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب تحديد اللغة الطبيعية الافتراضية لكل النص الموجود في الملف بواسطة إدخال Lang في قاموس كتالوج المستند.
يجب الإشارة إلى كل المحتوى النصي داخل الملف الذي يختلف عن اللغة الافتراضية باستخدام خاصية `Lang` المرفقة بتسلسل محتوى محدد، أو عن طريق إدخال Lang في قاموس عناصر البنية ...
ISO-19005-2، 6.7.4
بالإضافة إلى ذلك بالنسبة لـ PDF/UA-1، تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب الإعلان عن اللغة الطبيعية... يجب الإعلان عن التغييرات في اللغة الطبيعية.
ISO-14289-1، 7.2
في هذه الكتلة، يمكنك رؤية أمثلة: كيفية التأكد من تحديد اللغة بشكل صحيح (قم بالتوسيع لرؤية التفاصيل).
يجب على المستخدمين التأكد من تحديد اللغة بشكل صحيح في مستند Word المصدر:
أو مستند PDF الناتج:
التسمية التوضيحية الشكل
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
تسمح مستندات Microsoft Word للمستخدمين بإضافة تسمية توضيحية للأشكال.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب أن يتم وضع علامة توضيحية على التسمية التوضيحية المصاحبة للشخصية بعلامة توضيحية.
ISO-14289-1، 7.3
حاليًا، لا يستطيع Aspose.Words تصدير التسميات التوضيحية باستخدام علامة التسمية التوضيحية، لذلك يجب وضع علامة عليها في ملف PDF الناتج.
في هذه الكتلة، يمكنك رؤية أمثلة: كيفية إدراج التسمية التوضيحية (قم بالتوسيع لرؤية التفاصيل).
في Microsoft Word، يمكن إدراج التسمية التوضيحية من خلال قائمة السياق:
في Acrobat، يمكن إضافة التسمية التوضيحية أو تغييرها عبر مربع حوار خصائص `Object`:
الأوصاف البديلة
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
تتيح مستندات Microsoft Word للمستخدمين إضافة نص بديل إلى الصور والأشكال والجداول. يقوم Aspose.Words بتصدير مثل هذا النص البديل إلى ملف PDF الناتج.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
جميع عناصر البنية التي لا يحتوي محتواها على نظير نصي طبيعي محدد مسبقًا، مثل الصور والصيغ وما إلى ذلك، يجب أن توفر وصفًا نصيًا بديلاً باستخدام إدخال Alt في قاموس عناصر البنية...
ملحوظة: توفر الأوصاف البديلة أوصافًا نصية تساعد في التفسير الصحيح للمحتوى غير النصي المبهم.
ISO-19005-2، 6.7.5
في هذه الكتلة، يمكنك رؤية الأمثلة: كيفية التأكد من أن جميع العناصر تحتوي على نص بديل (قم بالتوسيع لرؤية التفاصيل).
يجب على المستخدمين التأكد من أن جميع العناصر تحتوي على نص بديل في مستند Word المصدر:
أو مستند PDF الناتج:
الأوصاف البديلة للارتباطات التشعبية
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
بالإضافة إلى النقطة السابقة، تسمح مستندات Microsoft Word أيضًا للمستخدمين بإضافة نص بديل إلى الارتباطات التشعبية. يقوم Aspose.Words بتصدير مثل هذا النص البديل إلى ملف PDF الناتج.
لسوء الحظ، ليس كل تطبيق يسمح لك بإعداد وصف بديل. على سبيل المثال، لا يتيح Adobe Acrobat حاليًا إعداد مثل هذا الوصف للارتباطات التشعبية. ولكن في Microsoft Word، يمكنك القيام بذلك على النحو التالي:
في بعض الأحيان تكون هناك مشكلة تتمثل في عدم إمكانية تعيين نص بديل للارتباطات التشعبية التي تم إنشاؤها تلقائيًا في جدول المحتويات (TOC) من خلال Microsoft Word GUI. يمكن لـ Aspose.Words تحديث هذه الحقول وإنشاء الروابط من تلقاء نفسها.
اتبع مثال الكود لتحديث حقول TOC
باستخدام Aspose.Words Document Object Model (DOM):
Document doc = new Document(fileName);
var tocHyperLinks = doc.Range.Fields
.Where(f => f.Type == FieldType.FieldHyperlink)
.Cast<FieldHyperlink>()
.Where(f => f.HRef.StartsWith("#_Toc"));
foreach (FieldHyperlink link in tocHyperLinks)
link.ScreenTip = link.DisplayResult;
PdfSaveOptions opt = new PdfSaveOptions()
{
Compliance = PdfCompliance.PdfUa1,
DisplayDocTitle = true,
ExportDocumentStructure = true,
};
opt.OutlineOptions.HeadingsOutlineLevels = 3;
opt.OutlineOptions.CreateMissingOutlineLevels = true;
var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
doc.Save(outFile, opt);
رؤوس الجدول
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
يجب أن تحتوي الجداول الموجودة في مستندات PDF/UA-1 على رؤوس - عمود أو صف أو كليهما. يتطلب PDF/A فقط ترميز جدول قياسي، وليس له أي قيود إضافية. لاحظ أن Aspose.Words يقوم بإنشاء ترميز الجدول القياسي تلقائيًا.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب أن تتضمن الجداول رؤوسًا... يمكن أن تحتوي الجداول على رؤوس أعمدة أو رؤوس صفوف أو كليهما.
ISO-14289-1، 7.5
في هذه الكتلة، يمكنك رؤية أمثلة: كيفية تعيين رأس الجدول (قم بالتوسيع لرؤية التفاصيل).
يمكن إعداد رأس الجدول إما في مستند Microsoft Word المصدر:
أو ملف PDF الناتج:
نص بديل
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
المواصفات تخبرنا بما يلي:
جميع عناصر البنية النصية التي يتم تمثيلها بطريقة غير قياسية، على سبيل المثال، الأحرف المخصصة أو الرسومات المضمنة، يجب أن توفر نصًا بديلاً باستخدام إدخال `ActualText` في قاموس عناصر البنية...
ISO-19005-2، 6.7.7
لا يسمح مستند Microsoft Word للمستخدمين بتعيين نص بديل. لذلك يجب التحقق من ذلك وإصلاحه في ملف PDF الناتج:
الاختصارات والمختصرات التوسعات
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
قوات الدفاع الشعبي/UA-1 |
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب وضع جميع حالات الاختصارات والمختصرات في المحتوى النصي في تسلسل محتوى مميز مع علامة Span التي توفر خاصيتها E توسيعًا نصيًا للاختصار أو الاختصار...
ISO-19005-2، 6.7.8
لا يسمح مستند Microsoft Word للمستخدمين بتعيين الاختصارات وتوسعات المختصرات. لذلك يجب التحقق من ذلك وإصلاحه في ملف PDF الناتج:
عنوان الوثيقة
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/A-4 | |
قوات الدفاع الشعبي/UA-1 |
يجب أن يكون للمستند بتنسيق PDF/UA-1 عنوان |
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
المواصفات تخبرنا بما يلي:
يجب أن يحتوي تدفق البيانات التعريفية في قاموس كتالوج الوثيقة على إدخال dc:title، حيث dc هي البادئة الموصى بها لمخطط بيانات تعريف Dublin Core...
ISO-14289-1، 7.1
في هذه الكتلة، يمكنك رؤية أمثلة: كيفية تعيين عنوان المستند (قم بالتوسيع لرؤية التفاصيل).
يمكن إعداد عنوان المستند إما في مستند Microsoft Word المصدر:
أو ملف PDF الناتج:
متطلبات الخط
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2u | |
PDF/A-4 | |
قوات الدفاع الشعبي/UA-1 |
يوجد أيضًا عدد من الفروق الدقيقة في العمل مع الخطوط عند التحويل إلى تنسيقات PDF/A-1 أو PDF/A-2 أو PDF/A-4 أو PDF/UA-1 باستخدام Aspose.Words. يجب أن تؤخذ في الاعتبار إذا كنت تريد تجنب المشاكل المحتملة في مستند الإخراج.
تصف الأقسام أدناه هذه الفروق الدقيقة والخيارات لحلها.
المتطلبات القانونية للخط
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2u | |
PDF/A-4 | |
قوات الدفاع الشعبي/UA-1 |
لا يتحقق Aspose.Words من القيود القانونية للخطوط المستخدمة – فالأمر متروك للمستخدمين. بمعنى آخر، لا ينبغي للمستخدم توفير خطوط غير مناسبة لتحويل PDF باستخدام Aspose.Words.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب استخدام برامج الخطوط التي يمكن تضمينها قانونيًا في ملف للعرض العالمي غير المحدود فقط.
ISO-19005-2، 6.2.11.4.1؛ ISO-14289-1، 7.21.4.1 (نفس علامات الاقتباس تمامًا في مواصفتين)
نوتديف Glyph
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2u | |
PDF/A-4 | |
قوات الدفاع الشعبي/UA-1 |
يحظر استخدام .notdef
glyph. سيظهر .notdef
glyph إذا كان المستند يحتوي على أحرف غير موجودة في الخط المحدد والتي لا يمكن حلها أيضًا عبر آلية Font Fallback.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
يجب ألا تحتوي الوثيقة المطابقة على إشارة إلى .notdef glyph من أي نص يظهر عوامل التشغيل، بغض النظر عن وضع عرض النص، في أي تدفق محتوى.
ISO-19005-2، 6.2.11.8؛ ISO-14289-1، 7.21.8 (نفس علامات الاقتباس تمامًا في مواصفتين)
في هذه الكتلة، يمكنك رؤية أمثلة: كيفية إزالة هذه الأحرف أو استبدالها (قم بالتوسيع لرؤية التفاصيل).
يجب على المستخدمين إزالة هذه الأحرف أو استبدالها في مستند Word المصدر:
أو مستند PDF الناتج باستخدام أداة "Edit PDF":
منطقة الاستخدام الخاص (PUA)
مستويات الامتثال القياسية لـ PDF داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2u | |
PDF/A-4 | |
قوات الدفاع الشعبي/UA-1 |
تظهر أحرف منطقة الاستخدام الخاص (PUA) في الغالب لخطوط Windows الرمزية مثل “Symbol” و"Wingdings" و"Webdings" وغيرها. لا توفر تنسيقات Microsoft Word خيارًا لتخزين النص الفعلي للأحرف.
تخبرنا المواصفات بما يلي (قم بالتوسيع لرؤية التفاصيل):
بالنسبة لمطابقة المستوى أ فقط، ولأي حرف ... تم تعيينه إلى رمز أو أكواد في منطقة الاستخدام الخاص Unicode (PUA)، يجب أن يكون إدخال النص الفعلي ... موجودًا لهذا الحرف أو سلسلة من الأحرف منها الشخصية هي جزء.
ISO-19005-2، 6.2.11.7.3
“Segoe UI Icon” هو خط Windows Unicode والذي يمكن استخدامه كبديل للخطوط الرمزية.
في هذه الكتلة، يمكنك رؤية أمثلة: ما يجب على المستخدم فعله لحل مشكلة الخطوط الرمزية (قم بالتوسيع لرؤية التفاصيل).
استبدل الخط الرمزي بخط Unicode في مستند Word المصدر:
أو قم بإضافة إدخال ActualText إلى الأحرف الإشكالية في مستند PDF الناتج: