کار با PDF/A یا PDF/UA

فرمت PDF / A و PDF /UA چندین الزامات مربوط به محتوای سند را اعمال می کند که نمی تواند در طول تبدیل خودکار از یک سند در فرمت Word به PDF انجام شود. این الزامات باید قبل از تبدیل یا در یک سند Word یا در یک سند PDF پس از تبدیل به منظور تولید یک سند کاملا PDF / A و PDF / سازگار با AU تایید و اصلاح شود.

الزامات پایه برای ساختار یا فونت های یک سند PDF / A و PDF /UA است که ما در بخش های زیر در نظر می گیریم.

الزامات ساختار سند

الزامات فعلی برای فرمت های PDF/A-1a، PDF/A-2a، PDF/A-4 و PDF/UA-1 است.

برخی از تفاوت های چگونگی Aspose.Words هنگام تبدیل به استانداردهای فرمت مختلف PDF کار می کند. آنها باید در نظر گرفته شوند اگر می خواهید نتیجه مورد انتظار را دریافت کنید.

زیر توضیح می دهد که چگونه Aspose.Words هنگام تبدیل به استانداردهای فرمت مختلف و گزینه های مختلف برای راه حل خود کار می کند.

ساختار نوع

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

یک سند PDF توالی بلوک هایی مانند سرفصل ها، پاراگراف ها، جداول و دیگران است. این بلوک ها ساختار سند را به شدت یا ضعیف تشکیل می دهند.

هر دو ساختار قوی و ضعیف برای PDF / A معتبر هستند. Microsoft Word اسناد دارای ساختار ضعیف توسط طراحی و Aspose.Words ایجاد PDF با ساختار ضعیف به ترتیب و همچنین ایجاد سرفصل با توجه به سطوح طرح پاراگراف در سند منبع.

برای یک سند PDF/UA-1 با یک ساختار ضعیف، لازم است که اعداد عنوان بدون شکاف وارد شوند.

برای اطمینان از خروجی صحیح، کاربران باید اطمینان حاصل کنند که محتوای سند منبع به درستی سازماندهی شده و سطوح طرح به درستی برای پاراگراف ها مشخص شده است. در غیر این صورت، کاربر باید ساختار سند PDF خروجی را تأیید و اصلاح کند.

علامت گذاری محتوا به عنوان یک Artifact

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

در حال حاضر، Aspose.Words عنوان صفحه هدر و پا، جداکننده های یادداشت، سلول های هدر جدول تکراری و تصاویر تزئینی به عنوان مصنوعات است. توجه داشته باشید که این لیست ممکن است در آینده به روز شود.

اگر یک سند حاوی هر محتوای دیگری باشد که باید به عنوان یک اثر هنری مشخص شود، یا اگر هر یک از محتوای مصنوعی یک محتوای واقعی باشد، مشتریان باید آن را در PDF خروجی اصلاح کنند.

مشخصات زبان طبیعی

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

زبان متن در Microsoft Word اسناد Aspose.Words صادرات زبان مشخص به یک PDF خروجی با Lang ویژگی های مرتبط با یک توالی مشخص محتوا یا یک برچسب اسپانیایی – توسط کنترل می شود ExportLanguageToSpanTag مالکیت به طور کلی هیچ مشکلی در زبان وجود ندارد که متن توسط کاربر وارد شود. Microsoft Word… اما این احتمال وجود دارد که زبان ممکن است نادرست باشد اگر متن به طور خودکار تولید شود.

شکل Caption

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word اسناد به کاربران اجازه می دهد تا عنوان رقم را اضافه کنند.

در حال حاضر Aspose.Words نمی تواند کپشن ها را با برچسب Caption صادر کند، بنابراین آنها باید در PDF خروجی پرچم گذاری شوند.

توضیحات جایگزین

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word اسناد به کاربران اجازه می دهد تا متن جایگزین را به تصاویر، شکل ها و جداول اضافه کنند. Aspose.Words صادرات چنین متن جایگزین به PDF خروجی

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

علاوه بر نکته قبلی، Microsoft Word اسناد همچنین به کاربران اجازه می دهد تا متن جایگزین را به لینک اضافه کنند. Aspose.Words صادرات چنین متن جایگزین به PDF خروجی

متأسفانه، همه برنامه ها به شما اجازه نمی دهند یک شرح جایگزین ایجاد کنید. برای مثال، Adobe Acrobat در حال حاضر قادر به تنظیم چنین توصیفی برای لینک ها نیست. اما در Microsoft Word, شما می توانید این کار را به صورت زیر انجام دهید:

alternate-descriptions-hyperlinks-mw

گاهی اوقات مشکلی وجود دارد که تنظیم متن alt برای لینک های خودکار در جدول محتویات (TOC) از طریق Microsoft Word GUI Aspose.Words می تواند این زمینه ها را به روز کند و لینک ها را به تنهایی ایجاد کند.

مثال کد را دنبال کنید تا به روز شود TOC زمینه های استفاده از Aspose.Words Document Object Model ()DOM):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

Table Headers

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

جداول در اسناد PDF /UA-1 باید دارای هدر - ستون، ردیف یا هر دو. PDF / A تنها نیاز به نشانه گذاری جدول استاندارد دارد که هیچ محدودیت اضافی ندارد. توجه داشته باشید که Aspose.Words نشانه گذاری جدول استاندارد را به صورت خودکار ایجاد کنید.

جایگزین Text

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word سند به کاربران اجازه نمی دهد متن جایگزین را تنظیم کنند. بنابراین این باید در PDF خروجی تایید و ثابت شود:

AcrobatReplacementText

اختصارات و گسترش Acronyms

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word سند به کاربران اجازه نمی دهد تا اختصار ها و گسترش های اختصاری را تنظیم کنند. بنابراین این باید در PDF خروجی تایید و ثابت شود:

AcrobatSplitAddExpansionText

عنوان مستند

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
سند در PDF /UA-1 باید یک عنوان داشته باشد

الزامات فونت

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

همچنین تعدادی از تفاوت های کار با فونت در هنگام تبدیل به PDF / A-1، PDF / A-2، PDF / A-4 یا فرمت های PDF/UA-1 با استفاده از آن وجود دارد. Aspose.Words… آنها باید در نظر گرفته شوند اگر شما می خواهید از مشکلات احتمالی با سند خروجی اجتناب کنید.

بخش های زیر این تفاوت ها و گزینه های راه حل خود را توصیف می کنند.

الزامات قانونی

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words محدودیت های قانونی فونت های مورد استفاده را تایید نمی کند - آن را به کاربران است. به عبارت دیگر، یک کاربر نباید فونت های نامناسب برای تبدیل فایل های PDF را با استفاده از آن ارائه دهد. Aspose.Words…

.عدم دفاع Glyph

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

استفاده از .notdef glyph ممنوع است. The The The The The The .notdef glyph به نظر می رسد اگر یک سند شامل کاراکترهایی باشد که در فونت انتخاب شده وجود نداشته باشند و همچنین نمی توانند از طریق مکانیسم سقوط فونت حل شوند.

منطقه استفاده خصوصی (PUA)

سطح انطباق استاندارد PDF در داخل Aspose.Words حضور نیاز
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

شخصیت های استفاده خصوصی (PUA) عمدتا برای Windows فونت های نمادین مانند “Symbol”، “Wingdings”، “Webdings” و دیگران. Microsoft Word فرمت ها یک گزینه برای ذخیره متن واقعی برای شخصیت ها ارائه نمی دهند.

“Segoe UI Symbol” یک نماد است Windows فونت یونیکد که می تواند به عنوان یک جایگزین برای فونت های نمادین استفاده شود.