کار با PDF/A یا PDF/UA

فرمت PDF/A و PDF/UA چندین الزامات مربوط به محتوای سند را تحمیل می کند که نمی تواند در طول تبدیل خودکار از یک سند در قالب Word به PDF برآورده شود. این الزامات باید در یک سند Word قبل از تبدیل یا در یک سند PDF پس از تبدیل تأیید و اصلاح شوند تا یک سند کاملا مطابق با PDF/A و PDF/UA تولید شود.

الزامات اساسی برای ساختار یا فونت های یک سند PDF/A و PDF/UA است که در بخش های زیر به آن خواهیم پرداخت.

الزامات ساختار سند

الزامات فعلی برای PDF/A-1a, PDF/A-2a, PDF/A-4, و PDF/UA-1 فرمت ها.

برخی از تفاوت های ظریف در نحوه کار Aspose.Words هنگام تبدیل به استانداردهای مختلف فرمت PDF وجود دارد. اگر می خواهید نتیجه مورد انتظار را بدست آورید، باید آنها را در نظر بگیرید.

زیربخش های زیر تفاوت های ظریف نحوه کار Aspose.Words را هنگام تبدیل به استانداردهای مختلف فرمت PDF و گزینه های راه حل آنها توصیف می کنند.

نوع ساختار

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

یک سند PDF یک دنباله از بلوک ها مانند عناوین، پاراگراف ها، جداول و دیگران است. این بلوک ها یک ساختار سند را تشکیل می دهند-قوی یا ضعیف.

هر دو ساختار قوی و ضعیف برای PDF/A معتبر هستند. Microsoft Word اسناد دارای ساختار ضعیف از نظر طراحی هستند و Aspose.Words PDF را با ساختار ضعیف ایجاد می کند و همچنین عناوین را با توجه به سطوح طرح پاراگراف ها در سند منبع تولید می کند.

برای یک سند PDF/UA-1 با ساختار ضعیف، علاوه بر این لازم است که شماره های عنوان بدون شکاف به ترتیب باشند.

برای اطمینان از خروجی صحیح، کاربران باید اطمینان حاصل کنند که محتوای سند منبع به درستی سازماندهی شده و سطوح طرح به درستی برای پاراگراف ها مشخص شده است. در غیر این صورت، کاربر باید ساختار سند خروجی PDF را تأیید و اصلاح کند.

علامت گذاری محتوا به عنوان یک اثر هنری

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

در حال حاضر، Aspose.Words سرصفحه ها و پای صفحه، جداکننده های یادداشت، سلول های سرصفحه جدول تکراری و تصاویر تزئینی را به عنوان مصنوعات نشان می دهد. توجه داشته باشید که این لیست ممکن است در آینده به روز شود.

اگر یک سند حاوی هر محتوای دیگری باشد که باید به عنوان یک اثر هنری مشخص شود، یا اگر هر یک از محتوای مصنوعی یک محتوای واقعی باشد، مشتریان باید آن را در خروجی PDF اصلاح کنند.

مشخصات زبان طبیعی

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

زبان متن در اسناد Microsoft Word مشخص شده است. Aspose.Words زبان مشخص شده را به یک خروجی PDF با ویژگی Lang متصل به یک توالی محتوای مشخص شده یا یک برچسب Span صادر می کند-توسط ویژگی ExportLanguageToSpanTag کنترل می شود. به طور کلی هیچ مشکلی در زبان وجود ندارد وقتی متن توسط کاربر از طریق Microsoft Word وارد می شود. اما احتمال وجود دارد که زبان ممکن است نادرست باشد اگر متن به طور خودکار تولید شود.

عنوان تصویر

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word اسناد به کاربران اجازه می دهد تا عنوان شکل را اضافه کنند.

در حال حاضر Aspose.Words نمی تواند زیرنویس ها را با برچسب زیرنویس صادر کند، بنابراین باید در خروجی PDF علامت گذاری شوند.

توضیحات متناوب

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word اسناد به کاربران اجازه می دهد تا متن جایگزین را به تصاویر، اشکال و جداول اضافه کنند. Aspose.Words چنین متن جایگزین را به خروجی PDF صادر می کند.

توضیحات متناوب برای پیوندها

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

علاوه بر نکته قبلی، اسناد Microsoft Word همچنین به کاربران اجازه می دهد تا متن جایگزین را به لینک های فرعی اضافه کنند. Aspose.Words چنین متن جایگزین را به خروجی PDF صادر می کند.

متأسفانه، هر برنامه به شما امکان نمی دهد توضیحات متناوب را تنظیم کنید. به عنوان مثال، Adobe Acrobat در حال حاضر امکان تنظیم چنین توصیفی برای پیوندها را ندارد. اما در Microsoft Word می توانید این کار را به صورت زیر انجام دهید:

alternate-descriptions-hyperlinks-mw

گاهی اوقات مشکلی وجود دارد که امکان تنظیم متن alt برای لینک های خود تولید شده در جدول محتویات (TOC) از طریق Microsoft Word GUI وجود ندارد. Aspose.Words می تواند چنین زمینه هایی را به روز کند و لینک ها را به تنهایی تولید کند.

برای به روز رسانی فیلد های TOC با استفاده از مدل Aspose.Words Document Object (DOM)از مثال کد پیروی کنید:

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

سرصفحه های جدول

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

جداول در اسناد PDF/UA-1 باید دارای سرصفحه باشند-ستون، ردیف یا هر دو. PDF/A فقط نیاز به علامت گذاری جدول استاندارد دارد که هیچ محدودیت اضافی ندارد. توجه داشته باشید که Aspose.Words علامت گذاری جدول استاندارد را به طور خودکار تولید می کند.

متن جایگزین

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word document به کاربران اجازه نمی دهد متن جایگزین را تنظیم کنند. پس این باید در خروجی PDFتایید و اصلاح شود:

AcrobatReplacementText

اختصارات و اختصارها گسترش

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word document به کاربران اجازه نمی دهد که اختصارات و اختصارها را گسترش دهند. پس این باید در خروجی PDFتایید و اصلاح شود:

AcrobatSplitAddExpansionText

عنوان سند

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
سند در PDF/UA-1 باید یک عنوان داشته باشد.

الزامات فونت

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

همچنین تعدادی از تفاوت های ظریف کار با فونت ها در هنگام تبدیل به PDF/A-1, PDF/A-2, PDF/A-4 یا فرمت های PDF/UA-1 با استفاده از Aspose.Words. اگر می خواهید از مشکلات احتمالی سند خروجی جلوگیری کنید، باید آنها را در نظر بگیرید.

بخش های زیر چنین تفاوت های ظریف و گزینه هایی را برای راه حل خود توصیف می کنند.

فونت الزامات قانونی

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words محدودیت های قانونی فونت های استفاده شده را تأیید نمی کند – این به کاربران بستگی دارد. به عبارت دیگر، کاربر نباید فونت های نامناسب برای تبدیل PDF با استفاده از Aspose.Words ارائه دهد.

.notdef Glyph

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

استفاده از گلیف .notdef ممنوع است. گلیف .notdef ظاهر خواهد شد اگر یک سند شامل کاراکتر هایی باشد که در فونت انتخاب شده وجود ندارند و همچنین نمی توانند از طریق مکانیزم فونت فال بک حل شوند.

منطقه استفاده خصوصی (PUA)

PDF سطح انطباق استاندارد در Aspose.Words وجود نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

منطقه استفاده خصوصی (PUA) کاراکترها بیشتر برای فونت های نمادین Windows مانند “نماد”، “بال”، “وبینگ” و دیگران ظاهر می شوند. فرمت های Microsoft Word گزینه ای برای ذخیره متن واقعی برای کاراکترها ارائه نمی دهند.

“Segoe UI Symbol” یک فونت یونیکد Windows است که می تواند به عنوان جایگزین فونت های نمادین استفاده شود.