العمل مع PDF/A أو PDF/UA

يفرض تنسيق PDF/A و PDF/UA العديد من المتطلبات المتعلقة بمحتوى المستند والتي لا يمكن الوفاء بها أثناء التحويل التلقائي من مستند بتنسيق ورد إلى PDF. يجب التحقق من هذه المتطلبات وتصحيحها إما في مستند ورد قبل التحويل أو في مستند PDF بعد التحويل من أجل إنتاج مستند متوافق PDF/A و PDF/UA بالكامل.

المتطلبات الأساسية هي لهيكل أو خطوط وثيقة PDF/A و PDF/UA، والتي سننظر فيها في الأقسام التالية.

متطلبات هيكل الوثيقة

المتطلبات الحالية هي ل PDF/A-1a, PDF/A-2a, PDF/A-4, و PDF/UA-1 التنسيقات.

هناك بعض الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF مختلفة. يجب أن تؤخذ بعين الاعتبار إذا كنت ترغب في الحصول على النتيجة المتوقعة.

تصف الأقسام الفرعية أدناه الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير وخيارات تنسيق PDF مختلفة لحلها.

نوع الهيكل

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

المستند PDF عبارة عن سلسلة من الكتل مثل العناوين والفقرات والجداول وغيرها. تشكل هذه الكتل بنية وثيقة-قوية أو ضعيفة.

كل من الهياكل القوية والضعيفة صالحة لـ PDF/A. تحتوي المستندات Microsoft Word على بنية ضعيفة حسب التصميم، و Aspose.Words ينشئ PDF مع البنية الضعيفة على التوالي وينشئ أيضا عناوين وفقا لمستويات المخطط التفصيلي للفقرات في المستند المصدر.

بالنسبة لمستند PDF/UA-1 بهيكل ضعيف، يلزم أيضا أن يتم ترتيب أرقام العناوين بدون ثغرات.

لضمان الإخراج الصحيح، يجب على المستخدمين التأكد من أن محتوى المستند المصدر منظم بشكل صحيح وأن مستويات المخطط التفصيلي محددة بشكل صحيح للفقرات. خلاف ذلك، يجب على المستخدم التحقق من هيكل الناتج PDF المستند وإصلاحه.

وضع علامة على المحتوى باعتباره قطعة أثرية

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

في الوقت الحالي، يمثل Aspose.Words رؤوس الصفحات وتذييلاتها وفواصل الملاحظات وخلايا رأس الجدول المتكررة والصور الزخرفية كتحف. لاحظ أنه قد يتم تحديث هذه القائمة في المستقبل.

إذا كان المستند يحتوي على أي محتوى آخر يجب وضع علامة عليه كقطعة أثرية، أو إذا كان أي من المحتوى المصنوع يدويا محتوى حقيقيا، فيجب على العملاء إصلاح ذلك في الإخراج PDF.

مواصفات اللغة الطبيعية

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

يتم تحديد لغة النص في Microsoft Word الوثائق. Aspose.Words تصدر اللغة المحددة إلى إخراج PDF مع السمة Lang المرفقة بتسلسل محتوى محدد أو علامة امتداد-يتم التحكم فيها بواسطة ExportLanguageToSpanTag خاصية. بشكل عام، لا توجد مشكلات في اللغة عند إدخال النص بواسطة المستخدم عبر Microsoft Word. ولكن هناك احتمال أن تكون اللغة غير دقيقة إذا تم إنشاء النص تلقائيا.

شرح الشكل

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word وثائق تسمح للمستخدمين بإضافة شرح الشكل.

حاليا Aspose.Words لا يمكن تصدير التسميات التوضيحية بعلامة التسمية التوضيحية، لذلك يجب وضع علامة عليها في الإخراج PDF.

أوصاف بديلة

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word تسمح المستندات للمستخدمين بإضافة نص بديل إلى الصور والأشكال والجداول. Aspose.Words يصدر مثل هذا النص البديل إلى الناتج PDF.

أوصاف بديلة للارتباطات التشعبية

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

بالإضافة إلى النقطة السابقة، تتيح المستندات Microsoft Word للمستخدمين أيضا إضافة نص بديل إلى الارتباطات التشعبية. Aspose.Words يصدر مثل هذا النص البديل إلى الناتج PDF.

لسوء الحظ، لا يسمح لك كل تطبيق بإعداد وصف بديل. على سبيل المثال، لا يمكن Adobe Acrobat حاليا إعداد مثل هذا الوصف للارتباطات التشعبية. ولكن في Microsoft Word، يمكنك القيام بذلك على النحو التالي:

alternate-descriptions-hyperlinks-mw

في بعض الأحيان تكون هناك مشكلة في أنه لا يمكن تعيين نص بديل للارتباطات التشعبية التي تم إنشاؤها تلقائيا في جدول المحتويات (TOC) من خلال Microsoft Word GUI. Aspose.Words يمكن تحديث هذه الحقول وإنشاء الروابط من تلقاء نفسها.

اتبع مثال الكود لتحديث TOC الحقول باستخدام Aspose.Words نموذج كائن المستند (DOM):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

رؤوس الجدول

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

يجب أن تحتوي الجداول في المستندات PDF/UA-1 على رؤوس-عمود أو صف أو كليهما. PDF/A يتطلب فقط ترميز الجدول القياسي، والذي لا يحتوي على قيود إضافية. لاحظ أن Aspose.Words يولد ترميز الجدول القياسي تلقائيا.

نص بديل

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word لا يسمح المستند للمستخدمين بتعيين نص بديل. لذلك يجب التحقق من هذا وتثبيته في الإخراج PDF:

AcrobatReplacementText

الاختصارات والاختصارات التوسعات

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word وثيقة لا تسمح للمستخدمين لتعيين الاختصارات والاختصارات التوسعات. لذلك يجب التحقق من هذا وتثبيته في الإخراج PDF:

AcrobatSplitAddExpansionText

عنوان الوثيقة

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
يجب أن يكون للوثيقة في PDF/UA-1 عنوان.

متطلبات الخط

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

هناك أيضا عدد من الفروق الدقيقة في العمل مع الخطوط عند التحويل إلى PDF/A-1, PDF/A-2, PDF/A-4 أو PDF/UA-1 التنسيقات باستخدام Aspose.Words. يجب أن تؤخذ في الاعتبار إذا كنت ترغب في تجنب المشاكل المحتملة مع مستند الإخراج.

تصف الأقسام أدناه هذه الفروق الدقيقة والخيارات لحلها.

المتطلبات القانونية للخط

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words لا يتحقق من القيود القانونية للخطوط المستخدمة-الأمر متروك للمستخدمين. بمعنى آخر، يجب على المستخدم عدم تقديم خطوط غير مناسبة للتحويل PDF باستخدام Aspose.Words.

.ندف Glyph

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

استخدام .notdef الصورة الرمزية محظور. سيظهر الحرف الرسومي .notdef إذا كان المستند يحتوي على أحرف غير موجودة في الخط المحدد والتي لا يمكن حلها أيضا عبر آلية احتياطي الخط.

منطقة الاستخدام الخاص (PUA)

PDF مستويات الامتثال القياسية داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

منطقة الاستخدام الخاص (PUA) تظهر الأحرف في الغالب لـ Windows الخطوط الرمزية مثل" الرمز “و” الأجنحة “و” الويب " وغيرها. Microsoft Word لا توفر التنسيقات خيارا لتخزين النص الفعلي للأحرف.

“سيجو UI رمز” هو Windows يونيكود الخط الذي يمكن استخدامه كبديل للخطوط الرمزية.