کار با PDF/A یا PDF/UA
فرمت PDF / A و PDF /UA چندین الزامات مربوط به محتوای سند را اعمال می کند که نمی تواند در طول تبدیل خودکار از یک سند در فرمت Word به PDF انجام شود. این الزامات باید قبل از تبدیل یا در یک سند Word یا در یک سند PDF پس از تبدیل به منظور تولید یک سند کاملا PDF / A و PDF / سازگار با AU تایید و اصلاح شود.
الزامات پایه برای ساختار یا فونت های یک سند PDF / A و PDF /UA است که ما در بخش های زیر در نظر می گیریم.
الزامات ساختار سند
الزامات فعلی برای فرمت های PDF/A-1a، PDF/A-2a، PDF/A-4 و PDF/UA-1 است.
برخی از تفاوت های چگونگی Aspose.Words هنگام تبدیل به استانداردهای فرمت مختلف PDF کار می کند. آنها باید در نظر گرفته شوند اگر می خواهید نتیجه مورد انتظار را دریافت کنید.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
برای نویسندگان توصیه می شود که اطلاعات ساختاری یا معنایی را با استفاده از فرآیندهای خودکار بدون تأیید مناسب تولید کنند.
ISO 19005-2, 6.7.1
زیر توضیح می دهد که چگونه Aspose.Words هنگام تبدیل به استانداردهای فرمت مختلف و گزینه های مختلف برای راه حل خود کار می کند.
ساختار نوع
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
یک سند PDF توالی بلوک هایی مانند سرفصل ها، پاراگراف ها، جداول و دیگران است. این بلوک ها ساختار سند را به شدت یا ضعیف تشکیل می دهند.
هر دو ساختار قوی و ضعیف برای PDF / A معتبر هستند. Microsoft Word اسناد دارای ساختار ضعیف توسط طراحی و Aspose.Words ایجاد PDF با ساختار ضعیف به ترتیب و همچنین ایجاد سرفصل با توجه به سطوح طرح پاراگراف در سند منبع.
برای یک سند PDF/UA-1 با یک ساختار ضعیف، لازم است که اعداد عنوان بدون شکاف وارد شوند.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
ساختار سطح بلوک ممکن است یکی از دو پارادایم اصلی را دنبال کند:
ISO32000-1, 14.8.4.3.5
برای اسناد PDF /UA-1، مشخصات شامل اضافه شدن به سطوح عنوان (در حال حاضر و دیدن جزئیات):
اگر معنایی سند نیاز به یک توالی نزولی از هدرها داشته باشد، چنین دنباله ای باید به ترتیب عددی دقیق ادامه دهد و سطح عنوان مداخله را از بین ببرد. H1 H3 مجاز است، در حالی که H1 H3 نیست.
ISO-14289-1, 7.4.2
برای اطمینان از خروجی صحیح، کاربران باید اطمینان حاصل کنند که محتوای سند منبع به درستی سازماندهی شده و سطوح طرح به درستی برای پاراگراف ها مشخص شده است. در غیر این صورت، کاربر باید ساختار سند PDF خروجی را تأیید و اصلاح کند.
در این بلوک، شما می توانید نمونه ها را ببینید: چگونه برای تعیین سطوح در این بلوک Microsoft Word یا بررسی و تعمیر ساختار سند PDF خروجی (در حال حاضر برای دیدن جزئیات).
In In In Microsoft Word به طور پیش فرض "Heading X" می تواند برای تنظیم سطح طرح استفاده شود:
علاوه بر این، سطح طرح را می توان در پنجره "Paragraph" بررسی یا تغییر داد:
در آکروبات، ساختار سند را می توان در قسمت "Tags" بررسی یا تغییر داد:
علامت گذاری محتوا به عنوان یک Artifact
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
در حال حاضر، Aspose.Words عنوان صفحه هدر و پا، جداکننده های یادداشت، سلول های هدر جدول تکراری و تصاویر تزئینی به عنوان مصنوعات است. توجه داشته باشید که این لیست ممکن است در آینده به روز شود.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
اشیاء گرافیکی در یک سند را می توان به دو کلاس تقسیم کرد:
ISO32000-1, 14.8.2.2.1
اگر یک سند حاوی هر محتوای دیگری باشد که باید به عنوان یک اثر هنری مشخص شود، یا اگر هر یک از محتوای مصنوعی یک محتوای واقعی باشد، مشتریان باید آن را در PDF خروجی اصلاح کنند.
در این بلوک، شما می توانید نمونه هایی را مشاهده کنید: چگونه شکل ها را به عنوان تزئینی در تزئینی علامت گذاری کنید Microsoft Word یا شکل علامت به عنوان یک اثر هنری در سند PDF خروجی (در حال حاضر برای دیدن جزئیات).
به عنوان مثال، شکل می تواند به عنوان تزئینی در Microsoft Word, بنابراین آنها به PDF به عنوان یک اثر هنری صادر می شوند:
شما می توانید شکل را به عنوان یک مصنوع در PDF خروجی علامت گذاری کنید:
همچنین می توانید متن را در یک هدر از مصنوعات به محتوای واقعی در PDF خروجی تغییر دهید:
مشخصات زبان طبیعی
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
زبان متن در Microsoft Word اسناد Aspose.Words صادرات زبان مشخص به یک PDF خروجی با Lang ویژگی های مرتبط با یک توالی مشخص محتوا یا یک برچسب اسپانیایی – توسط کنترل می شود ExportLanguageToSpanTag مالکیت به طور کلی هیچ مشکلی در زبان وجود ندارد که متن توسط کاربر وارد شود. Microsoft Word… اما این احتمال وجود دارد که زبان ممکن است نادرست باشد اگر متن به طور خودکار تولید شود.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
زبان طبیعی پیش فرض برای تمام متن در یک فایل باید توسط ورودی لانگ در فرهنگ لغت کاتالوگ سند مشخص شود.
تمام محتوای متنی در یک فایل که با زبان پیش فرض متفاوت است باید با استفاده از یک فایل مشخص شود. `Lang` مالکیت متصل به یک توالی محتوا مشخص، یا با ورود لانگ در یک فرهنگ لغت عنصر ساختار.
ISO- 19005-2، 6.7.4
علاوه بر PDF /UA-1، مشخصات به ما می گوید (در حال حاضر برای دیدن جزئیات):
زبان طبیعی اعلام خواهد شد ... تغییرات در زبان طبیعی اعلام خواهد شد.
ISO-14289-1, 7.2
در این بلوک، شما می توانید نمونه هایی را ببینید: چگونه اطمینان حاصل کنید که زبان به درستی مشخص شده است (برای مشاهده جزئیات).
کاربران باید اطمینان حاصل کنند که زبان به درستی در هر دو سند کلمه منبع مشخص شده است:
یا سند PDF خروجی:
شکل Caption
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word اسناد به کاربران اجازه می دهد تا عنوان رقم را اضافه کنند.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
یک جمله همراه با یک عدد باید با برچسب Caption تگ شود.
ISO-14289-1, 7.3
در حال حاضر Aspose.Words نمی تواند کپشن ها را با برچسب Caption صادر کند، بنابراین آنها باید در PDF خروجی پرچم گذاری شوند.
در این بلوک، شما می توانید نمونه هایی را ببینید: چگونه برای قرار دادن عنوان (در حال حاضر برای دیدن جزئیات).
In In In Microsoft Word, عنوان را می توان از طریق منوی زمینه وارد کرد:
در Acrobat عنوان می تواند اضافه یا تغییر از طریق `Object` ویژگی ها:
توضیحات جایگزین
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
Microsoft Word اسناد به کاربران اجازه می دهد تا متن جایگزین را به تصاویر، شکل ها و جداول اضافه کنند. Aspose.Words صادرات چنین متن جایگزین به PDF خروجی
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
تمام عناصر ساختاری که محتوای آنها یک آنالوگ متنی طبیعی از پیش تعیین شده ندارد، به عنوان مثال تصاویر، فرمول و غیره، باید یک توصیف متن جایگزین با استفاده از ورودی Alt در فرهنگ لغت عنصر ساختار ارائه دهد.
یادآوری توصیف های جایگزین توصیف های متنی را ارائه می دهند که به تفسیر صحیح محتوای غیر متنی کمک می کند.
ISO- 19005-2، 6.7.5
در این بلوک، شما می توانید نمونه ها را ببینید: چگونه اطمینان حاصل کنید که تمام عناصر یک متن جایگزین دارند (برای مشاهده جزئیات).
کاربران باید اطمینان حاصل کنند که تمام عناصر دارای یک متن جایگزین در هر دو سند Word منبع هستند:
یا سند PDF خروجی:
توضیحات جایگزین برای Hyperlinks
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
علاوه بر نکته قبلی، Microsoft Word اسناد همچنین به کاربران اجازه می دهد تا متن جایگزین را به لینک اضافه کنند. Aspose.Words صادرات چنین متن جایگزین به PDF خروجی
متأسفانه، همه برنامه ها به شما اجازه نمی دهند یک شرح جایگزین ایجاد کنید. برای مثال، Adobe Acrobat در حال حاضر قادر به تنظیم چنین توصیفی برای لینک ها نیست. اما در Microsoft Word, شما می توانید این کار را به صورت زیر انجام دهید:
گاهی اوقات مشکلی وجود دارد که تنظیم متن alt برای لینک های خودکار در جدول محتویات (TOC) از طریق Microsoft Word GUI Aspose.Words می تواند این زمینه ها را به روز کند و لینک ها را به تنهایی ایجاد کند.
مثال کد را دنبال کنید تا به روز شود TOC
زمینه های استفاده از Aspose.Words Document Object Model ()DOM):
Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();
for (Field field : doc.getRange().getFields()) {
if (field.getType() == FieldType.FIELD_HYPERLINK) {
FieldHyperlink hyperlink = (FieldHyperlink) field;
if (hyperlink.getFieldCode().startsWith("#_Toc")) {
tocHyperLinks.add(hyperlink);
}
}
}
for (FieldHyperlink link : tocHyperLinks)
link.setScreenTip(link.getDisplayResult());
PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);
String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);
Table Headers
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
جداول در اسناد PDF /UA-1 باید دارای هدر - ستون، ردیف یا هر دو. PDF / A تنها نیاز به نشانه گذاری جدول استاندارد دارد که هیچ محدودیت اضافی ندارد. توجه داشته باشید که Aspose.Words نشانه گذاری جدول استاندارد را به صورت خودکار ایجاد کنید.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
جدول ها باید شامل هدر ... جدول ها می توانند شامل هدرهای ستون، سر ردیف یا هر دو باشند.
ISO-14289-1, 7.5
در این بلوک، شما می توانید نمونه هایی را ببینید: چگونه برای تنظیم هدر جدول (در حال حاضر برای دیدن جزئیات).
هدر جدول را می توان تنظیم کرد Microsoft Word سند:
یا pdf خروجی:
جایگزین Text
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
مشخصات به ما می گوید:
تمام عناصر ساختار متن که به صورت غیر استاندارد نشان داده می شوند، به عنوان مثال، شخصیت های سفارشی یا گرافیک خط، باید متن جایگزین را با استفاده از متن جایگزین ارائه دهند. `ActualText` ورود به فرهنگ لغت عنصر ساختار ...
ISO- 19005-2، 6.7.7
Microsoft Word سند به کاربران اجازه نمی دهد متن جایگزین را تنظیم کنند. بنابراین این باید در PDF خروجی تایید و ثابت شود:
اختصارات و گسترش Acronyms
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/UA-1 |
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
تمام موارد اختصار و اختصار در محتوای متنی باید در یک توالی مشخص محتوا با یک برچسب اسپانیایی قرار گیرد که اموال E آن یک گسترش متنی از اختصار یا اختصار را فراهم می کند.
ISO- 19005-2، 6.7.8
Microsoft Word سند به کاربران اجازه نمی دهد تا اختصار ها و گسترش های اختصاری را تنظیم کنند. بنابراین این باید در PDF خروجی تایید و ثابت شود:
عنوان مستند
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-2a | |
PDF/A-4 | |
PDF/UA-1 |
سند در PDF /UA-1 باید یک عنوان داشته باشد |
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
مشخصات به ما می گوید:
جریان متاداده در فرهنگ لغت کاتالوگ سند باید حاوی یک ورودی DC باشد، که در آن DC پیشوند توصیه شده برای طرح ابرداده هسته دوبلین است.
ISO-14289-1, 7.1
در این بلوک، شما می توانید نمونه هایی را ببینید: چگونه عنوان سند را تنظیم کنید (برای مشاهده جزئیات).
عنوان سند را می توان تنظیم کرد Microsoft Word سند:
یا pdf خروجی:
الزامات فونت
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
همچنین تعدادی از تفاوت های کار با فونت در هنگام تبدیل به PDF / A-1، PDF / A-2، PDF / A-4 یا فرمت های PDF/UA-1 با استفاده از آن وجود دارد. Aspose.Words… آنها باید در نظر گرفته شوند اگر شما می خواهید از مشکلات احتمالی با سند خروجی اجتناب کنید.
بخش های زیر این تفاوت ها و گزینه های راه حل خود را توصیف می کنند.
الزامات قانونی
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
Aspose.Words محدودیت های قانونی فونت های مورد استفاده را تایید نمی کند - آن را به کاربران است. به عبارت دیگر، یک کاربر نباید فونت های نامناسب برای تبدیل فایل های PDF را با استفاده از آن ارائه دهد. Aspose.Words…
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
فقط برنامه های فونت که به طور قانونی در یک فایل برای نامحدود جاسازی شده اند، ارائه جهانی باید مورد استفاده قرار گیرد.
ISO- 19005-2، 6.2.11.4.1؛ ISO-14289-1، 7.21.4.1 (به طور دقیق همان نقل قول ها در دو نوع)
.عدم دفاع Glyph
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
استفاده از .notdef
glyph ممنوع است. The The The The The The .notdef
glyph به نظر می رسد اگر یک سند شامل کاراکترهایی باشد که در فونت انتخاب شده وجود نداشته باشند و همچنین نمی توانند از طریق مکانیسم سقوط فونت حل شوند.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
یک سند انطباقی نباید شامل یک مرجع به notdef باشد. glyph از هر یک از اپراتورهای نمایش متن، صرف نظر از حالت رندر متن، در هر جریان محتوا.
ISO- 19005-2، 6.2.11.8؛ ISO-14289-1، 7.21.8 (به طور دقیق همان نقل قول ها را در دو نوع)
در این بلوک، شما می توانید نمونه هایی را ببینید: چگونه این شخصیت ها را حذف یا جایگزین کنید (برای مشاهده جزئیات).
کاربران باید این شخصیت ها را در هر دو سند کلمه منبع حذف یا جایگزین کنند:
یا سند PDF خروجی با استفاده از ابزار "Edit PDF":
منطقه استفاده خصوصی (PUA)
سطح انطباق استاندارد PDF در داخل Aspose.Words | حضور نیاز |
---|---|
PDF/A-1a | |
PDF/A-1b | |
PDF/A-2a | |
PDF/A-2b | |
PDF/A-4 | |
PDF/UA-1 |
شخصیت های استفاده خصوصی (PUA) عمدتا برای Windows فونت های نمادین مانند “Symbol”، “Wingdings”، “Webdings” و دیگران. Microsoft Word فرمت ها یک گزینه برای ذخیره متن واقعی برای شخصیت ها ارائه نمی دهند.
مشخصات به ما می گوید: (در حال حاضر برای دیدن جزئیات):
برای سطح فقط، برای هر کاراکتر ... که به یک کد یا کد در منطقه استفاده خصوصی یونیکد (PUA) نقشه برداری می شود، یک ورودی متن واقعی برای این شخصیت یا یک توالی از شخصیت هایی که چنین شخصیتی بخشی است، وجود خواهد داشت.
ISO- 19005-2، 6.2.11.7.3
“Segoe UI Symbol” یک نماد است Windows فونت یونیکد که می تواند به عنوان یک جایگزین برای فونت های نمادین استفاده شود.
در این بلوک، شما می توانید نمونه ها را ببینید: چه کاربر باید برای حل مشکل با فونت های نمادین (در حال حاضر برای دیدن جزئیات) انجام دهد.
جایگزین فونت نمادین با یک کدیک در سند Word منبع:
یا یک ورودی متن واقعی را به کاراکترهای مشکل ساز در سند PDF خروجی اضافه کنید: