العمل مع PDF/A أو PDF/UA

يفرض تنسيق PDF/A وPDF/UA العديد من المتطلبات المتعلقة بمحتوى المستند والتي لا يمكن تلبيتها أثناء التحويل التلقائي من مستند بتنسيق Word إلى PDF. يجب التحقق من هذه المتطلبات وتصحيحها إما في مستند Word قبل التحويل أو في مستند PDF بعد التحويل من أجل إنتاج مستند متوافق تمامًا مع PDF/A وPDF/UA.

المتطلبات الأساسية تتعلق ببنية أو خطوط مستند PDF/A وPDF/UA، والتي سنأخذها في الاعتبار في الأقسام التالية.

متطلبات هيكل الوثيقة

المتطلبات الحالية هي لتنسيقات PDF/A-1a، وPDF/A-2a، وPDF/A-4، وPDF/UA-1.

هناك بعض الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF المختلفة. يجب أن تؤخذ بعين الاعتبار إذا كنت ترغب في الحصول على النتيجة المتوقعة.

تصف الأقسام الفرعية أدناه الفروق الدقيقة في كيفية عمل Aspose.Words عند التحويل إلى معايير تنسيق PDF المختلفة وخيارات الحلول الخاصة بها.

نوع الهيكل

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1 tick

مستند PDF عبارة عن سلسلة من الكتل مثل العناوين والفقرات والجداول وغيرها. تشكل هذه الكتل بنية مستندية - قوية أو ضعيفة.

كل من الهياكل القوية والضعيفة صالحة لـ PDF/A. تتميز مستندات Microsoft Word ببنية ضعيفة حسب التصميم، ويقوم Aspose.Words بإنشاء PDF ببنية ضعيفة على التوالي، كما يقوم أيضًا بإنشاء عناوين وفقًا لمستويات الخطوط العريضة للفقرات في المستند المصدر.

بالنسبة لمستند PDF/UA-1 ذي البنية الضعيفة، يلزم بالإضافة إلى ذلك أن تكون أرقام العناوين مرتبة دون فجوات.

لضمان الإخراج الصحيح، يتعين على المستخدمين التأكد من تنظيم محتوى المستند المصدر بشكل صحيح وتحديد مستويات المخطط التفصيلي للفقرات بشكل صحيح. بخلاف ذلك، يجب على المستخدم التحقق من بنية مستند PDF الناتج وإصلاحه.

وضع علامة على المحتوى باعتباره قطعة أثرية

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1 tick

في الوقت الحالي، يقوم Aspose.Words بوضع علامة على رؤوس الصفحات وتذييلاتها، وفواصل الملاحظات، وخلايا رأس الجدول المتكررة، والصور المزخرفة على أنها قطع أثرية. لاحظ أنه قد يتم تحديث هذه القائمة في المستقبل.

إذا كان المستند يحتوي على أي محتوى آخر يجب وضع علامة عليه على أنه قطعة أثرية، أو إذا كان أي من المحتوى المصنوع محتوى حقيقيًا، فيجب على العملاء إصلاح ذلك في ملف PDF الناتج.

مواصفات اللغة الطبيعية

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1 tick

يتم تحديد لغة النص في مستندات Microsoft Word. يقوم Aspose.Words بتصدير اللغة المحددة إلى ملف PDF الناتج مع سمة Lang المرفقة بتسلسل محتوى محدد أو علامة Span - ويتم التحكم فيها بواسطة خاصية ExportLanguageToSpanTag. بشكل عام، لا توجد مشكلات لغوية عندما يقوم المستخدم بإدخال النص عبر Microsoft Word. ولكن هناك احتمال أن تكون اللغة غير دقيقة إذا تم إنشاء النص تلقائيًا.

التسمية التوضيحية الشكل

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
قوات الدفاع الشعبي/UA-1 tick

تسمح مستندات Microsoft Word للمستخدمين بإضافة تسمية توضيحية للأشكال.

حاليًا، لا يستطيع Aspose.Words تصدير التسميات التوضيحية باستخدام علامة التسمية التوضيحية، لذلك يجب وضع علامة عليها في ملف PDF الناتج.

الأوصاف البديلة

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1 tick

تتيح مستندات Microsoft Word للمستخدمين إضافة نص بديل إلى الصور والأشكال والجداول. يقوم Aspose.Words بتصدير مثل هذا النص البديل إلى ملف PDF الناتج.

الأوصاف البديلة للارتباطات التشعبية

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
قوات الدفاع الشعبي/UA-1 tick

بالإضافة إلى النقطة السابقة، تسمح مستندات Microsoft Word أيضًا للمستخدمين بإضافة نص بديل إلى الارتباطات التشعبية. يقوم Aspose.Words بتصدير مثل هذا النص البديل إلى ملف PDF الناتج.

لسوء الحظ، ليس كل تطبيق يسمح لك بإعداد وصف بديل. على سبيل المثال، لا يتيح Adobe Acrobat حاليًا إعداد مثل هذا الوصف للارتباطات التشعبية. ولكن في Microsoft Word، يمكنك القيام بذلك على النحو التالي:

الأوصاف بديل-الارتباطات التشعبية-mw

في بعض الأحيان تكون هناك مشكلة تتمثل في عدم إمكانية تعيين نص بديل للارتباطات التشعبية التي تم إنشاؤها تلقائيًا في جدول المحتويات (TOC) من خلال Microsoft Word GUI. يمكن لـ Aspose.Words تحديث هذه الحقول وإنشاء الروابط من تلقاء نفسها.

اتبع مثال الكود لتحديث حقول TOC باستخدام Aspose.Words Document Object Model (DOM):

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

رؤوس الجدول

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
قوات الدفاع الشعبي/UA-1 tick

يجب أن تحتوي الجداول الموجودة في مستندات PDF/UA-1 على رؤوس - عمود أو صف أو كليهما. يتطلب PDF/A فقط ترميز جدول قياسي، وليس له أي قيود إضافية. لاحظ أن Aspose.Words يقوم بإنشاء ترميز الجدول القياسي تلقائيًا.

نص بديل

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1

لا يسمح مستند Microsoft Word للمستخدمين بتعيين نص بديل. لذلك يجب التحقق من ذلك وإصلاحه في ملف PDF الناتج:

AcrobatReplacementText

الاختصارات والمختصرات التوسعات

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-2a tick
قوات الدفاع الشعبي/UA-1

لا يسمح مستند Microsoft Word للمستخدمين بتعيين الاختصارات وتوسعات المختصرات. لذلك يجب التحقق من ذلك وإصلاحه في ملف PDF الناتج:

AcrobatSplitAddExpansionText

عنوان الوثيقة

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-2a
PDF/A-4
قوات الدفاع الشعبي/UA-1 tick
يجب أن يكون للمستند بتنسيق PDF/UA-1 عنوان

متطلبات الخط

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
قوات الدفاع الشعبي/UA-1 tick

يوجد أيضًا عدد من الفروق الدقيقة في العمل مع الخطوط عند التحويل إلى تنسيقات PDF/A-1 أو PDF/A-2 أو PDF/A-4 أو PDF/UA-1 باستخدام Aspose.Words. يجب أن تؤخذ في الاعتبار إذا كنت تريد تجنب المشاكل المحتملة في مستند الإخراج.

تصف الأقسام أدناه هذه الفروق الدقيقة والخيارات لحلها.

المتطلبات القانونية للخط

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
قوات الدفاع الشعبي/UA-1 tick

لا يتحقق Aspose.Words من القيود القانونية للخطوط المستخدمة – فالأمر متروك للمستخدمين. بمعنى آخر، لا ينبغي للمستخدم توفير خطوط غير مناسبة لتحويل PDF باستخدام Aspose.Words.

نوتديف Glyph

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
قوات الدفاع الشعبي/UA-1 tick

يحظر استخدام .notdef glyph. سيظهر .notdef glyph إذا كان المستند يحتوي على أحرف غير موجودة في الخط المحدد والتي لا يمكن حلها أيضًا عبر آلية Font Fallback.

منطقة الاستخدام الخاص (PUA)

مستويات الامتثال القياسية لـ PDF داخل Aspose.Words وجود الشرط
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
قوات الدفاع الشعبي/UA-1

تظهر أحرف منطقة الاستخدام الخاص (PUA) في الغالب لخطوط Windows الرمزية مثل “Symbol” و"Wingdings" و"Webdings" وغيرها. لا توفر تنسيقات Microsoft Word خيارًا لتخزين النص الفعلي للأحرف.

“Segoe UI Icon” هو خط Windows Unicode والذي يمكن استخدامه كبديل للخطوط الرمزية.