کار با PDF/A یا PDF/UA

فرمت PDF/A و PDF/UA الزامات متعددی را در رابطه با محتوای سند تحمیل می کند که در طی تبدیل خودکار از یک سند با فرمت Word به PDF قابل انجام نیست. این الزامات باید در یک سند Word قبل از تبدیل یا در یک سند PDF پس از تبدیل تأیید و تصحیح شود تا یک سند کاملاً سازگار با PDF/A و PDF/UA تولید شود.

الزامات اساسی برای ساختار یا فونت های یک سند PDF/A و PDF/UA است که در بخش های بعدی به بررسی آن ها خواهیم پرداخت.

الزامات ساختار سند

الزامات فعلی برای فرمت های PDF/A-1a، PDF/A-2a، PDF/A-4 و PDF/UA-1 هستند.

نکات ظریفی در مورد نحوه عملکرد Aspose.Words هنگام تبدیل به استانداردهای مختلف فرمت PDF وجود دارد. اگر می خواهید به نتیجه مورد انتظار برسید باید آنها را در نظر گرفت.

بخش‌های فرعی زیر تفاوت‌های ظریف نحوه عملکرد Aspose.Words را هنگام تبدیل به استانداردهای مختلف فرمت PDF و گزینه‌هایی برای راه‌حل آن‌ها شرح می‌دهند.

نوع ساختار

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

یک سند PDF دنباله ای از بلوک ها مانند سرفصل ها، پاراگراف ها، جداول و موارد دیگر است. این بلوک ها یک ساختار سند را تشکیل می دهند - قوی یا ضعیف.

هر دو ساختار قوی و ضعیف برای PDF/A معتبر هستند. اسناد Microsoft Word از نظر طراحی ساختار ضعیفی دارند و Aspose.Words به ترتیب PDF با ساختار ضعیف ایجاد می کند و همچنین عناوین را با توجه به سطوح کلی پاراگراف ها در سند منبع ایجاد می کند.

برای یک سند PDF/UA-1 با ساختار ضعیف، علاوه بر این لازم است که اعداد عنوان بدون شکاف به ترتیب باشند.

برای اطمینان از خروجی صحیح، کاربران باید اطمینان حاصل کنند که محتوای سند منبع به درستی سازماندهی شده است و سطوح طرح کلی به درستی برای پاراگراف ها مشخص شده است. در غیر این صورت، کاربر باید ساختار سند PDF خروجی را بررسی و اصلاح کند.

علامت گذاری محتوا به عنوان یک مصنوع

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

در حال حاضر، Aspose.Words سرصفحه‌ها و پاورقی‌های صفحه، جداکننده‌های یادداشت، سلول‌های هدر جدول تکراری و تصاویر تزئینی را به‌عنوان مصنوع علامت‌گذاری می‌کند. توجه داشته باشید که این لیست ممکن است در آینده به روز شود.

اگر سندی حاوی محتوای دیگری است که باید به‌عنوان مصنوع علامت‌گذاری شود، یا اگر هر یک از محتوای مصنوعی یک محتوای واقعی است، مشتریان باید آن را در PDF خروجی برطرف کنند.

مشخصات زبان طبیعی

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

زبان متن در اسناد Microsoft Word مشخص شده است. Aspose.Words زبان مشخص شده را به یک PDF خروجی با ویژگی Lang متصل به یک توالی محتوای علامت‌گذاری شده یا یک تگ Span صادر می‌کند - توسط ویژگی export_language_to_span_tag کنترل می‌شود. معمولاً وقتی متن توسط کاربر از طریق Microsoft Word وارد می شود، مشکل زبانی وجود ندارد. اما این احتمال وجود دارد که اگر متن به صورت خودکار تولید شود، زبان ممکن است نادرست باشد.

توضیحات جایگزین

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

اسناد Microsoft Word به کاربران این امکان را می دهد که متن جایگزینی را به تصاویر، اشکال و جداول اضافه کنند. Aspose.Words چنین متن جایگزینی را به PDF خروجی صادر می کند.

متن جایگزین

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

سند Microsoft Word به کاربران اجازه تنظیم متن جایگزین را نمی دهد. بنابراین این باید در PDF خروجی تأیید و رفع شود:

AcrobatReplacementText

اختصارات و کلمات اختصاری بسط

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

سند Microsoft Word به کاربران اجازه نمی دهد اختصارات و بسط های اختصاری را تنظیم کنند. بنابراین این باید در PDF خروجی تأیید و رفع شود:

AcrobatSplitAddExpansionText

مورد نیاز فونت

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

همچنین هنگام تبدیل به فرمت‌های PDF/A-1، PDF/A-2، PDF/A-4 یا PDF/UA-1 با استفاده از Aspose.Words، تفاوت‌های ظریف کار با فونت‌ها وجود دارد. اگر می خواهید از مشکلات احتمالی سند خروجی جلوگیری کنید، باید آنها را در نظر گرفت.

بخش های زیر چنین تفاوت های ظریف و گزینه هایی را برای حل آنها شرح می دهد.

الزامات قانونی فونت

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words محدودیت های قانونی فونت های استفاده شده را تأیید نمی کند - این به عهده کاربران است. به عبارت دیگر، کاربر نباید فونت های نامناسبی را برای تبدیل PDF با استفاده از Aspose.Words ارائه کند.

notdef Glyph

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

استفاده از .notdef glyph ممنوع است. اگر سندی حاوی کاراکترهایی باشد که در فونت انتخاب شده وجود ندارند و همچنین نمی توان آنها را از طریق مکانیسم Font Fallback حل کرد، .notdef glyph ظاهر می شود.

منطقه کاربری خصوصی (PUA)

سطوح انطباق استاندارد PDF در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

نویسه‌های منطقه استفاده خصوصی (PUA) بیشتر برای فونت‌های نمادین Windows مانند “Symbol”، “Wingdings”، “Webdings” و دیگران ظاهر می‌شوند. فرمت های Microsoft Word گزینه ای برای ذخیره متن واقعی برای کاراکترها ارائه نمی دهند.

“Segoe UI Symbol” یک فونت Windows Unicode است که می تواند به عنوان جایگزینی برای فونت های نمادین استفاده شود.