العمل مع PDF/A أو PDF/UA
يفرض تنسيق PDF/A و PDF/UA العديد من المتطلبات المتعلقة بمحتوى المستند والتي لا يمكن الوفاء بها أثناء التحويل التلقائي من مستند بتنسيق ورد إلى PDF. يجب التحقق من هذه المتطلبات وتصحيحها إما في مستند ورد قبل التحويل أو في مستند PDF بعد التحويل من أجل إنتاج مستند متوافق PDF/A و PDF/UA بالكامل.
المتطلبات الأساسية هي لهيكل أو خطوط وثيقة PDF/A و PDF/UA، والتي سننظر فيها في الأقسام التالية.
متطلبات هيكل الوثيقة
المتطلبات الحالية هي ل PDF/A-1a, PDF/A-2a, PDF/A-4, و PDF/UA-1 التنسيقات.
هناك بعض الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF مختلفة. يجب أن تؤخذ بعين الاعتبار إذا كنت ترغب في الحصول على النتيجة المتوقعة.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
من غير المستحسن للكتاب توليد معلومات هيكلية أو دلالية باستخدام العمليات الآلية دون التحقق المناسب.
ISO 19005-2, 6.7.1
تصف الأقسام الفرعية أدناه الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير وخيارات تنسيق PDF مختلفة لحلها.
نوع الهيكل
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
المستند PDF عبارة عن سلسلة من الكتل مثل العناوين والفقرات والجداول وغيرها. تشكل هذه الكتل بنية وثيقة-قوية أو ضعيفة.
كل من الهياكل القوية والضعيفة صالحة لـ PDF/A. تحتوي المستندات Microsoft Word على بنية ضعيفة حسب التصميم، و Aspose.Words ينشئ PDF مع البنية الضعيفة على التوالي وينشئ أيضا عناوين وفقا لمستويات المخطط التفصيلي للفقرات في المستند المصدر.
بالنسبة لمستند PDF/UA-1 بهيكل ضعيف، يلزم أيضا أن يتم ترتيب أرقام العناوين بدون ثغرات.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
قد يتبع الهيكل على مستوى الكتلة أحد نموذجين رئيسيين:
ISO-32000-1, 14.8.4.3.5
بالنسبة للمستندات PDF/UA-1، تحتوي المواصفات على إضافة تتعلق بمستويات العناوين (توسيع للاطلاع على التفاصيل):
إذا كانت دلالات المستند تتطلب تسلسلا تنازليا للرؤوس، فيجب أن يستمر هذا التسلسل بترتيب رقمي صارم ويجب ألا يتخطى مستوى العنوان المتداخل. H1 H2 H3 جائز، بينما H1 H3 ليس كذلك.
ISO-14289-1, 7.4.2
لضمان الإخراج الصحيح، يجب على المستخدمين التأكد من أن محتوى المستند المصدر منظم بشكل صحيح وأن مستويات المخطط التفصيلي محددة بشكل صحيح للفقرات. خلاف ذلك، يجب على المستخدم التحقق من هيكل الناتج PDF المستند وإصلاحه.
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية تعيين مستويات المخطط التفصيلي في Microsoft Word أو التحقق من بنية مستند الإخراج PDF وإصلاحها (توسيع لرؤية التفاصيل).
في Microsoft Word يمكن استخدام أنماط "العنوان س" الافتراضية لتعيين مستوى المخطط التفصيلي:
بالإضافة إلى ذلك، يمكن التحقق من مستوى المخطط التفصيلي أو تغييره في نافذة " الفقرة:
في أكروبات، يمكن التحقق من بنية المستند أو تغييرها في جزء " العلامات:
وضع علامة على المحتوى باعتباره قطعة أثرية
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
في الوقت الحالي، يمثل Aspose.Words رؤوس الصفحات وتذييلاتها وفواصل الملاحظات وخلايا رأس الجدول المتكررة والصور الزخرفية كتحف. لاحظ أنه قد يتم تحديث هذه القائمة في المستقبل.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يمكن تقسيم كائنات الرسومات في المستند إلى فئتين:
ISO-32000-1, 14.8.2.2.1
إذا كان المستند يحتوي على أي محتوى آخر يجب وضع علامة عليه كقطعة أثرية، أو إذا كان أي من المحتوى المصنوع يدويا محتوى حقيقيا، فيجب على العملاء إصلاح ذلك في الإخراج PDF.
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية وضع علامة على الأشكال كزخرفة في Microsoft Word أو وضع علامة على الشكل كقطعة أثرية في مستند الإخراج PDF (قم بالتوسع لرؤية التفاصيل).
على سبيل المثال، يمكن تمييز الأشكال على أنها زخرفية في Microsoft Word، لذلك سيتم تصديرها إلى PDF كقطعة أثرية:
يمكنك وضع علامة على الشكل كقطعة أثرية في الإخراج PDF:
أيضا، يمكنك تبديل النص في رأس من الأداة إلى المحتوى الحقيقي في الإخراج PDF:
مواصفات اللغة الطبيعية
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
يتم تحديد لغة النص في Microsoft Word الوثائق. Aspose.Words تصدر اللغة المحددة إلى إخراج PDF مع السمة Lang المرفقة بتسلسل محتوى محدد أو علامة امتداد-يتم التحكم فيها بواسطة ExportLanguageToSpanTag خاصية. بشكل عام، لا توجد مشكلات في اللغة عند إدخال النص بواسطة المستخدم عبر Microsoft Word. ولكن هناك احتمال أن تكون اللغة غير دقيقة إذا تم إنشاء النص تلقائيا.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب تحديد اللغة الطبيعية الافتراضية لجميع النصوص في الملف بواسطة إدخال لانج في قاموس كتالوج المستند.
يجب الإشارة إلى كل المحتوى النصي داخل ملف يختلف عن اللغة الافتراضية باستخدام `Lang` خاصية مرفقة بتسلسل محتوى محدد، أو عن طريق إدخال لانج في قاموس عنصر البنية ...
ISO-19005-2, 6.7.4
بالإضافة إلى PDF/UA-1، تخبرنا المواصفات بما يلي (توسيع لرؤية التفاصيل):
تعلن اللغة الطبيعية-تعلن التغييرات في اللغة الطبيعية.
ISO-14289-1, 7.2
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية التأكد من تحديد اللغة بشكل صحيح (توسيع لرؤية التفاصيل).
يجب على المستخدمين التأكد من تحديد اللغة بشكل صحيح في مستند الكلمة المصدر:
أو الإخراج PDF وثيقة:
شرح الشكل
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word وثائق تسمح للمستخدمين بإضافة شرح الشكل.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب وضع علامة على التسمية التوضيحية المصاحبة للرقم بعلامة التسمية التوضيحية.
ISO-14289-1, 7.3
حاليا Aspose.Words لا يمكن تصدير التسميات التوضيحية بعلامة التسمية التوضيحية، لذلك يجب وضع علامة عليها في الإخراج PDF.
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية إدراج التسمية التوضيحية (توسيع لرؤية التفاصيل).
في Microsoft Word، يمكن إدراج التسمية التوضيحية من خلال قائمة السياق:
في أكروبات، يمكن إضافة التسمية التوضيحية أو تغييرها عبر مربع حوار `Object` خصائص:
أوصاف بديلة
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word تسمح المستندات للمستخدمين بإضافة نص بديل إلى الصور والأشكال والجداول. Aspose.Words يصدر مثل هذا النص البديل إلى الناتج PDF.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
جميع عناصر البنية التي لا يحتوي محتواها على نظير نصي طبيعي محدد مسبقا، مثل الصور والصيغ وما إلى ذلك.، يجب توفير وصف نصي بديل باستخدام إدخال ألت في قاموس عنصر الهيكل...
NOTE توفر الأوصاف البديلة أوصافا نصية تساعد في التفسير الصحيح للمحتوى غير النصي غير الشفاف.
ISO-19005-2, 6.7.5
في هذه المجموعة، يمكنك الاطلاع على أمثلة: كيفية التأكد من أن جميع العناصر تحتوي على نص بديل (توسيع لرؤية التفاصيل).
يجب على المستخدمين التأكد من أن جميع العناصر لها نص بديل في مستند الكلمة المصدر:
أو الإخراج PDF وثيقة:
أوصاف بديلة للارتباطات التشعبية
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
بالإضافة إلى النقطة السابقة، تتيح المستندات Microsoft Word للمستخدمين أيضا إضافة نص بديل إلى الارتباطات التشعبية. Aspose.Words يصدر مثل هذا النص البديل إلى الناتج PDF.
لسوء الحظ، لا يسمح لك كل تطبيق بإعداد وصف بديل. على سبيل المثال، لا يمكن Adobe Acrobat حاليا إعداد مثل هذا الوصف للارتباطات التشعبية. ولكن في Microsoft Word، يمكنك القيام بذلك على النحو التالي:
في بعض الأحيان تكون هناك مشكلة في أنه لا يمكن تعيين نص بديل للارتباطات التشعبية التي تم إنشاؤها تلقائيا في جدول المحتويات (TOC) من خلال Microsoft Word GUI. Aspose.Words يمكن تحديث هذه الحقول وإنشاء الروابط من تلقاء نفسها.
اتبع مثال الكود لتحديث TOC
الحقول باستخدام Aspose.Words نموذج كائن المستند (DOM):
Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();
for (Field field : doc.getRange().getFields()) {
if (field.getType() == FieldType.FIELD_HYPERLINK) {
FieldHyperlink hyperlink = (FieldHyperlink) field;
if (hyperlink.getFieldCode().startsWith("#_Toc")) {
tocHyperLinks.add(hyperlink);
}
}
}
for (FieldHyperlink link : tocHyperLinks)
link.setScreenTip(link.getDisplayResult());
PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);
String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);
رؤوس الجدول
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
يجب أن تحتوي الجداول في المستندات PDF/UA-1 على رؤوس-عمود أو صف أو كليهما. PDF/A يتطلب فقط ترميز الجدول القياسي، والذي لا يحتوي على قيود إضافية. لاحظ أن Aspose.Words يولد ترميز الجدول القياسي تلقائيا.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب أن تتضمن الجداول رؤوس-يمكن أن تحتوي الجداول على رؤوس أعمدة أو رؤوس صف أو كليهما.
ISO-14289-1, 7.5
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية تعيين رأس الجدول (توسيع لرؤية التفاصيل).
يمكن إعداد رأس الجدول إما المصدر Microsoft Word وثيقة:
أو الإخراج PDF:
نص بديل
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
تخبرنا المواصفات بما يلي:
يجب أن توفر جميع عناصر البنية النصية التي يتم تمثيلها بطريقة غير قياسية، على سبيل المثال، الأحرف المخصصة أو الرسومات المضمنة، نصا بديلا باستخدام الإدخال `ActualText` في قاموس عنصر البنية...
ISO-19005-2, 6.7.7
Microsoft Word لا يسمح المستند للمستخدمين بتعيين نص بديل. لذلك يجب التحقق من هذا وتثبيته في الإخراج PDF:
الاختصارات والاختصارات التوسعات
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب وضع جميع مثيلات الاختصارات والمختصرات في المحتوى النصي في تسلسل محتوى محدد بعلامة امتداد توفر خاصية البريد الخاصة بها توسعا نصيا للاختصار أو الاختصار...
ISO-19005-2, 6.7.8
Microsoft Word وثيقة لا تسمح للمستخدمين لتعيين الاختصارات والاختصارات التوسعات. لذلك يجب التحقق من هذا وتثبيته في الإخراج PDF:
عنوان الوثيقة
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/A-4 | |
PDF/UA-1 |
يجب أن يكون للوثيقة في PDF/UA-1 عنوان. |
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
تخبرنا المواصفات بما يلي:
يجب أن يحتوي دفق البيانات الوصفية في قاموس كتالوج المستند على دس: إدخال العنوان، حيث دس هو البادئة الموصى بها لمخطط البيانات الوصفية الأساسية في دبلن…
ISO-14289-1, 7.1
في هذه المجموعة، يمكنك الاطلاع على أمثلة: كيفية تعيين عنوان المستند (توسيع للاطلاع على التفاصيل).
يمكن إعداد عنوان المستند إما المصدر Microsoft Word المستند:
أو الإخراج PDF:
متطلبات الخط
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
هناك أيضا عدد من الفروق الدقيقة في العمل مع الخطوط عند التحويل إلى PDF/A-1, PDF/A-2, PDF/A-4 أو PDF/UA-1 التنسيقات باستخدام Aspose.Words. يجب أن تؤخذ في الاعتبار إذا كنت ترغب في تجنب المشاكل المحتملة مع مستند الإخراج.
تصف الأقسام أدناه هذه الفروق الدقيقة والخيارات لحلها.
المتطلبات القانونية للخط
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
Aspose.Words لا يتحقق من القيود القانونية للخطوط المستخدمة-الأمر متروك للمستخدمين. بمعنى آخر، يجب على المستخدم عدم تقديم خطوط غير مناسبة للتحويل PDF باستخدام Aspose.Words.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب استخدام برامج الخطوط التي يمكن تضمينها قانونا في ملف لتقديم غير محدود وعالمي فقط.
ISO-19005-2, 6.2.11.4.1; ISO-14289-1, 7.21.4.1 (بالضبط نفس الاقتباسات في اثنين من المواصفات)
.ندف Glyph
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
استخدام .notdef
الصورة الرمزية محظور. سيظهر الحرف الرسومي .notdef
إذا كان المستند يحتوي على أحرف غير موجودة في الخط المحدد والتي لا يمكن حلها أيضا عبر آلية احتياطي الخط.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
يجب ألا تحتوي الوثيقة المطابقة على إشارة إلى .نوتديف الصورة الرمزية من أي من النص تظهر المشغلين، بغض النظر عن وضع تقديم النص، في أي تيار المحتوى.
ISO-19005-2, 6.2.11.8; ISO-14289-1, 7.21.8 (بالضبط نفس الاقتباسات في اثنين من المواصفات)
في هذه الكتلة، يمكنك الاطلاع على أمثلة: كيفية إزالة هذه الأحرف أو استبدالها (توسيع للاطلاع على التفاصيل).
يجب على المستخدمين إزالة هذه الأحرف أو استبدالها في مستند الكلمة المصدر:
أو مستند الإخراج PDF باستخدام أداة " تحرير PDF:
منطقة الاستخدام الخاص (PUA)
PDF مستويات الامتثال القياسية داخل Aspose.Words | وجود الشرط |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
منطقة الاستخدام الخاص (PUA) تظهر الأحرف في الغالب لـ Windows الخطوط الرمزية مثل" الرمز “و” الأجنحة “و” الويب " وغيرها. Microsoft Word لا توفر التنسيقات خيارا لتخزين النص الفعلي للأحرف.
المواصفات تخبرنا بما يلي (توسيع لرؤية التفاصيل):
لمستوى المطابقة فقط، لأي حرف ... التي تم تعيينها إلى رمز أو رموز في منطقة الاستخدام الخاص يونيكود (PUA)، إدخال ActualText... يجب أن تكون موجودة لهذه الشخصية أو سلسلة من الشخصيات التي تكون هذه الشخصية جزءا منها.
ISO-19005-2, 6.2.11.7.3
“سيجو UI رمز” هو Windows يونيكود الخط الذي يمكن استخدامه كبديل للخطوط الرمزية.
في هذه الكتلة، يمكنك رؤية أمثلة: ما الذي يجب على المستخدم فعله لحل المشكلة باستخدام الخطوط الرمزية (توسيع لمعرفة التفاصيل).
استبدل الخط الرمزي بخط يونيكود في مستند الكلمة المصدر:
أو أضف إدخال ActualText إلى الأحرف الإشكالية في مستند الإخراج PDF: