کار با PDF/A یا PDF/UA

فرمت PDF/A و PDF/UA الزامات متعددی را در رابطه با محتوای سند تحمیل می کند که در طی تبدیل خودکار از یک سند با فرمت Word به PDF قابل انجام نیست. این الزامات باید در یک سند Word قبل از تبدیل یا در یک سند PDF پس از تبدیل تأیید و تصحیح شود تا یک سند کاملاً سازگار با PDF/A و PDF/UA تولید شود.

الزامات اساسی برای ساختار یا فونت های یک سند PDF/A و PDF/UA است که در بخش های بعدی به بررسی آن ها خواهیم پرداخت.

الزامات ساختار سند

الزامات فعلی برای فرمت های PDF/A-1a، PDF/A-2a، PDF/A-4 و PDF/UA-1 هستند.

نکات ظریفی در مورد نحوه عملکرد Aspose.Words هنگام تبدیل به استانداردهای مختلف فرمت PDF وجود دارد. اگر می خواهید به نتیجه مورد انتظار برسید باید آنها را در نظر گرفت.

بخش‌های فرعی زیر تفاوت‌های ظریف نحوه عملکرد Aspose.Words را هنگام تبدیل به استانداردهای مختلف فرمت PDF و گزینه‌هایی برای راه‌حل آن‌ها شرح می‌دهند.

نوع ساختار

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

یک سند PDF دنباله ای از بلوک ها مانند سرفصل ها، پاراگراف ها، جداول و موارد دیگر است. این بلوک ها یک ساختار سند را تشکیل می دهند - قوی یا ضعیف.

هر دو ساختار قوی و ضعیف برای PDF/A معتبر هستند. اسناد Microsoft Word از نظر طراحی ساختار ضعیفی دارند و Aspose.Words به ترتیب PDF با ساختار ضعیف ایجاد می کند و همچنین عناوین را با توجه به سطوح کلی پاراگراف ها در سند منبع ایجاد می کند.

برای یک سند PDF/UA-1 با ساختار ضعیف، علاوه بر این لازم است که اعداد عنوان بدون شکاف به ترتیب باشند.

برای اطمینان از خروجی صحیح، کاربران باید اطمینان حاصل کنند که محتوای سند منبع به درستی سازماندهی شده است و سطوح طرح کلی به درستی برای پاراگراف ها مشخص شده است. در غیر این صورت، کاربر باید ساختار سند PDF خروجی را بررسی و اصلاح کند.

علامت گذاری محتوا به عنوان یک مصنوع

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

در حال حاضر، Aspose.Words سرصفحه‌ها و پاورقی‌های صفحه، جداکننده‌های یادداشت، سلول‌های هدر جدول تکراری و تصاویر تزئینی را به‌عنوان مصنوع علامت‌گذاری می‌کند. توجه داشته باشید که این لیست ممکن است در آینده به روز شود.

اگر سندی حاوی محتوای دیگری است که باید به‌عنوان مصنوع علامت‌گذاری شود، یا اگر هر یک از محتوای مصنوعی یک محتوای واقعی است، مشتریان باید آن را در PDF خروجی برطرف کنند.

مشخصات زبان طبیعی

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

زبان متن در اسناد Microsoft Word مشخص شده است. Aspose.Words زبان مشخص شده را به یک PDF خروجی با ویژگی Lang متصل به یک توالی محتوای علامت‌گذاری شده یا یک تگ Span صادر می‌کند - توسط ویژگی ExportLanguageToSpanTag کنترل می‌شود. معمولاً هنگام وارد کردن متن توسط کاربر از طریق Microsoft Word هیچ مشکلی در زبان وجود ندارد. اما این احتمال وجود دارد که اگر متن به صورت خودکار تولید شود، زبان ممکن است نادرست باشد.

شرح تصویر

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

اسناد Microsoft Word به کاربران این امکان را می دهد که شرح شکل را اضافه کنند.

در حال حاضر Aspose.Words نمی‌تواند زیرنویس‌ها را با برچسب Caption صادر کند، بنابراین باید در PDF خروجی پرچم‌گذاری شوند.

توضیحات جایگزین

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

اسناد Microsoft Word به کاربران این امکان را می دهد که متن جایگزینی را به تصاویر، اشکال و جداول اضافه کنند. Aspose.Words چنین متن جایگزینی را به PDF خروجی صادر می کند.

توضیحات جایگزین برای هایپرلینک ها

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

علاوه بر نکته قبلی، اسناد Microsoft Word همچنین به کاربران اجازه می دهد تا متن جایگزین را به لینک ها اضافه کنند. Aspose.Words چنین متن جایگزینی را به PDF خروجی صادر می کند.

متأسفانه، هر برنامه ای به شما اجازه نمی دهد که یک توضیح جایگزین تنظیم کنید. به عنوان مثال، Adobe Acrobat در حال حاضر تنظیم چنین توصیفی را برای لینک ها فعال نمی کند. اما در Microsoft Word می توانید این کار را به صورت زیر انجام دهید:

alternate-descriptions-hyperlinks-mw

گاهی اوقات مشکلی وجود دارد که امکان تنظیم متن جایگزین برای لینک‌های خودکار تولید شده در فهرست مطالب (TOC) از طریق رابط کاربری گرافیکی Microsoft Word وجود ندارد. Aspose.Words می تواند چنین فیلدهایی را به روز کند و پیوندها را به تنهایی ایجاد کند.

برای به روز رسانی فیلدهای TOC با استفاده از Aspose.Words Document Object Model (DOM) مثال کد را دنبال کنید:

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

سربرگ های جدول

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

جداول در اسناد PDF/UA-1 باید دارای سرصفحه – ستون، ردیف یا هر دو باشند. PDF/A فقط به نشانه گذاری جدول استاندارد نیاز دارد که هیچ محدودیت اضافی ندارد. توجه داشته باشید که Aspose.Words نشانه گذاری جدول استاندارد را به طور خودکار ایجاد می کند.

متن جایگزین

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

سند Microsoft Word به کاربران اجازه تنظیم متن جایگزین را نمی دهد. بنابراین این باید در PDF خروجی تأیید و رفع شود:

AcrobatReplacementText

اختصارات و کلمات اختصاری بسط

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

سند Microsoft Word به کاربران اجازه نمی دهد اختصارات و بسط های اختصاری را تنظیم کنند. بنابراین این باید در PDF خروجی تأیید و رفع شود:

AcrobatSplitAddExpansionText

عنوان سند

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
سند PDF/UA-1 باید دارای عنوان باشد

مورد نیاز فونت

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

همچنین هنگام تبدیل به فرمت‌های PDF/A-1، PDF/A-2، PDF/A-4 یا PDF/UA-1 با استفاده از Aspose.Words، تفاوت‌های ظریف کار با فونت‌ها وجود دارد. اگر می خواهید از مشکلات احتمالی سند خروجی جلوگیری کنید، باید آنها را در نظر گرفت.

بخش های زیر چنین تفاوت های ظریف و گزینه هایی را برای حل آنها شرح می دهد.

الزامات قانونی فونت

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words محدودیت های قانونی فونت های استفاده شده را تأیید نمی کند - این به عهده کاربران است. به عبارت دیگر، کاربر نباید فونت های نامناسبی را برای تبدیل PDF با استفاده از Aspose.Words ارائه کند.

notdef Glyph

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

استفاده از .notdef glyph ممنوع است. اگر سندی حاوی کاراکترهایی باشد که در فونت انتخاب شده وجود ندارند و همچنین نمی توان آنها را از طریق مکانیسم Font Fallback حل کرد، .notdef glyph ظاهر می شود.

منطقه کاربری خصوصی (PUA)

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1

نویسه‌های منطقه استفاده خصوصی (PUA) بیشتر برای فونت‌های نمادین Windows مانند “Symbol”، “Wingdings”، “Webdings” و موارد دیگر ظاهر می‌شوند. فرمت های Microsoft Word گزینه ای برای ذخیره متن واقعی برای کاراکترها ارائه نمی دهند.

“Segoe UI Symbol” یک فونت Windows Unicode است که می تواند به عنوان جایگزینی برای فونت های نمادین استفاده شود.