עבודה עם PDF/A או PDF/UA

פורמט PDF/A ו- PDF/UA מחייב מספר דרישות הקשורות לתוכן המסמך שלא ניתן להשלים במהלך המרה אוטומטית של מסמך בפורמט Word ל- PDF. דרישות אלה יש לאמת ולתקן במסמך Word לפני המרה או במסמך PDF לאחר המרה על מנת לייצר מסמך PDF/A ו- PDF/UA.

דרישות בסיסיות הן למבנה או גופנים של מסמך PDF/A ו- PDF/UA, אשר נבחן בסעיפים הבאים.

דרישות מבנה

הדרישות הנוכחיות הן ל- PDF/A-1a, PDF/A-2a, PDF/A-4 ו- PDF/UA-1.

יש כמה ניואנסים של איך Aspose.Words עובד בעת המרת תקני פורמט PDF שונים. יש לקחת בחשבון אם אתה רוצה לקבל את התוצאה הצפויה.

הקטעים הבאים מתארים את הניואנסים של איך Aspose.Words עובד בעת המרת תקני פורמט PDF שונים ואפשרויות לפתרון שלהם.

מבנה סוג

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

מסמך PDF הוא רצף של בלוקים כגון כותרות, פסקאות, שולחנות ואחרים. בלוקים אלה יוצרים מבנה מסמך – חזק או חלש.

שני המבנים החזקים והחלשים תקפים ל- PDF/A. Microsoft Word למסמכים יש מבנה חלש על ידי עיצוב, Aspose.Words יוצר PDF עם המבנה החלש בהתאמה וגם יוצר כותרות על פי רמות המתאר של פסקאות במסמך המקור.

עבור מסמך PDF / UA-1 עם מבנה חלש, יש צורך נוסף כי מספרי הכותרת הולכים על מנת ללא פערים.

כדי להבטיח את התפוקה הנכונה, משתמשים צריכים להבטיח כי התוכן של מסמך המקור מאורגן כראוי ואת רמות קווי המתאר מפורטים כראוי עבור פסקאות. אחרת, המשתמש צריך לאמת ולתקן את המבנה של מסמך PDF התפוקה.

כתיבת התוכן כאמנות

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

כרגע, Aspose.Words סימני עמוד ראשי ורגליים, שים לב מפרידים, תאים חוזרים על השולחן, ותמונות דקורטיביות כמו חפצים. שימו לב כי רשימה זו עשויה להיות מעודכנת בעתיד.

אם מסמך מכיל תוכן אחר שחייב להיות מסומן כחפץ, או אם כל אחד מהתכנים המוצפים הוא תוכן אמיתי, הלקוחות צריכים לתקן זאת בפלט PDF.

שפה טבעית

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

שפת טקסט מפורטת Microsoft Word מסמכים Aspose.Words מייצא את השפה המפורטת לפלט PDF עם Lang תכונה המצורפת לרצף תוכן מסומן או תג ספאן - הוא נשלט על ידי ExportLanguageToSpanTag רכוש. בדרך כלל אין בעיות שפה כאשר הטקסט נכנס על ידי המשתמש באמצעות Microsoft Word. אבל יש אפשרות שהשפה עשויה להיות לא מדויקת אם הטקסט נוצר באופן אוטומטי.

איור Caption

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word מסמכים מאפשרים למשתמשים להוסיף כותרת.

כיום Aspose.Words לא יכול לייצא כתוביות עם תג Caption, אז הם חייבים להיות מלוטשים בפלט PDF.

תיאורים אלטרנטיביים

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word מסמכים מאפשרים למשתמשים להוסיף טקסט חלופי לתמונות, צורות וטבלאות. Aspose.Words ייצוא טקסט חלופי לפלט PDF.

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

בנוסף לנקודה הקודמת, Microsoft Word מסמכים גם מאפשרים למשתמשים להוסיף טקסט חלופי להיפר קישורים. Aspose.Words ייצוא טקסט חלופי לפלט PDF.

למרבה הצער, לא כל יישום מאפשר לך להגדיר תיאור חלופי. לדוגמה, Adobe Acrobat כיום לא ניתן להגדיר תיאור כזה של Hyperlinks. אבל בפנים Microsoft Word, אתה יכול לעשות את זה כדלקמן:

alternate-descriptions-hyperlinks-mw

לפעמים יש בעיה כי לא ניתן להגדיר טקסט alt עבור היפרlinks מהופנט בטבלה של תוכן (TOC) דרך Microsoft Word GUI Aspose.Words יכול לעדכן שדות כאלה וליצור את הקישורים בכוחות עצמו.

עקבו אחר הדוגמא לעדכון TOC שדות באמצעות Aspose.Words Document Object Model ()DOM):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

כותרות שולחן

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

שולחנות ב- PDF/UA-1 מסמכים חייבים להיות ראשיים - עמודה, שורה או שניהם. PDF/A דורש רק סימון שולחן סטנדרטי, שאין לו מגבלות נוספות. שימו לב Aspose.Words יוצר את הסימון שולחן סטנדרטי באופן אוטומטי.

החלפת טקסט

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word מסמך אינו מאפשר למשתמשים להגדיר טקסט חלופי. לכן יש לאמת ולקבוע את הפלט PDF:

AcrobatReplacementText

Abbreviations ו- Acronyms

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word מסמך אינו מאפשר למשתמשים להגדיר קיצורים ו-Acronyms. לכן יש לאמת ולקבוע את הפלט PDF:

AcrobatSplitAddExpansionText

מסמך

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
מסמך PDF/UA-1 צריך להיות בעל שם

דרישות פונט

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

ישנם גם מספר ניואנסים של עבודה עם גופנים כאשר ממיר ל- PDF/A-1, PDF/A-2, PDF/A-4 או PDF/UA-1 פורמטים באמצעות PDF/UA-1. Aspose.Words. הם חייבים לקחת בחשבון אם אתה רוצה למנוע בעיות אפשריות עם מסמך הפלט.

הקטעים להלן מתארים ניואנסים ואפשרויות כאלה לפתרון שלהם.

דרישות משפטיות

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words לא לאמת את המגבלות החוקיות של הגופנים המשמשים - זה תלוי במשתמשים. במילים אחרות, המשתמש לא צריך לספק גופנים לא מתאימים להמרות PDF באמצעות שימוש Aspose.Words.

.לא הגנה Glyph

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

השימוש .notdef glyph אסור. The The The .notdef glyph יופיע אם מסמך מכיל דמויות שאינן קיימות בגופן הנבחר, אשר גם לא ניתן לפתור באמצעות מנגנון פונטה Fallback.

אזור שימוש פרטי (PUA)

תקן PDF Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

תווים לשימוש פרטי (PUA) מופיעים בעיקר עבור Windows גופנים סמליים כמו “Symbol”, “Wingdings”, “Webdings”, ואחרים. Microsoft Word פורמטים אינם מספקים אפשרות לאחסן טקסט בפועל עבור תווים.

“Segoe UIסמל” הוא סמל Windows גופן Unicode שניתן להשתמש בו כאלטרנטיבה לגופנים סמליים.