עבודה עם PDF/A או PDF/UA

PDF/A ו PDF/UA פורמט מטיל מספר דרישות הקשורות לתוכן המסמך שלא ניתן למלא במהלך המרה אוטומטית ממסמך ב Word פורמט ל PDF. דרישות אלה צריכות להיות מאומתות ומתוקנות במסמך Word לפני ההמרה או במסמך PDF לאחר ההמרה כדי להפיק מסמך תואם לחלוטין PDF/A ו - PDF/UA.

הדרישות הבסיסיות הן למבנה או לגופנים של מסמך PDF/A ו - PDF/UA, אותם נשקול בסעיפים הבאים.

דרישות מבנה המסמך

הדרישות הנוכחיות הן עבור PDF/A-1a, PDF/A-2a, PDF/A-4, ו PDF/UA-1 פורמטים.

יש כמה ניואנסים של איך Aspose.Words עובד בעת המרה לסטנדרטים שונים של פורמט PDF. הם חייבים להילקח בחשבון אם אתה רוצה לקבל את התוצאה הצפויה.

הפרקים הקטנים להלן מתארים ניואנסים של איך Aspose.Words עובד בעת המרה לסטנדרטים שונים של פורמט PDF ואפשרויות לפתרון שלהם.

סוג מבנה

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

מסמך PDF הוא רצף של בלוקים כגון כותרות, פסקאות, טבלאות ואחרים. בלוקים אלה יוצרים מבנה מסמך-חזק או חלש.

שני המבנים החזקים והחלשים תקפים עבור PDF/A. Microsoft Word למסמכים יש מבנה חלש לפי עיצוב, ו Aspose.Words יוצר PDF עם המבנה החלש בהתאמה וגם מייצר כותרות בהתאם לרמות המתאר של פסקאות במסמך המקור.

עבור מסמך PDF/UA-1 עם מבנה חלש, נדרש בנוסף שמספרי הכותרת יסתדרו ללא פערים.

כדי להבטיח פלט נכון, על המשתמשים לוודא שתוכן מסמך המקור מאורגן כראוי ורמות המתאר מוגדרות כהלכה לפסקאות. אחרת, על המשתמש לאמת ולתקן את מבנה הפלט PDF מסמך.

סימון התוכן כחפץ

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

כרגע, Aspose.Words מסמן כותרות עליונות ותחתונות של עמודים, מפרידי הערות, תאי כותרת טבלה חוזרים ותמונות דקורטיביות כממצאים. שים לב שרשימה זו עשויה להתעדכן בעתיד.

אם מסמך מכיל תוכן אחר שיש לסמן כחפץ, או אם כל התוכן המלאכותי הוא תוכן אמיתי, על הלקוחות לתקן זאת בפלט PDF.

מפרט שפה טבעית

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

שפת הטקסט מוגדרת במסמכים Microsoft Word. Aspose.Words מייצא את השפה שצוינה לפלט PDF עם התכונה Lang המצורפת לרצף תוכן מסומן או לתג טווח-היא נשלטת על ידי המאפיין ExportLanguageToSpanTag. בדרך כלל אין בעיות שפה כאשר המשתמש מזין טקסט באמצעות Microsoft Word. אך קיימת אפשרות שהשפה עשויה להיות לא מדויקת אם הטקסט נוצר באופן אוטומטי.

כיתוב איור

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word מסמכים מאפשרים למשתמשים להוסיף כיתוב איור.

נכון לעכשיו Aspose.Words לא ניתן לייצא כיתובים עם תג הכיתוב, ולכן יש לסמן אותם בפלט PDF.

תיאורים חלופיים

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word מסמכים מאפשרים למשתמשים להוסיף טקסט חלופי לתמונות, צורות וטבלאות. Aspose.Words מייצא טקסט חלופי כזה לפלט PDF.

תיאורים חלופיים עבור קישורים

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

בנוסף לנקודה הקודמת, Microsoft Word מסמכים מאפשרים למשתמשים להוסיף טקסט חלופי להיפר-קישורים. Aspose.Words מייצא טקסט חלופי כזה לפלט PDF.

למרבה הצער, לא כל יישום מאפשר לך להגדיר תיאור חלופי. לדוגמה, Adobe Acrobat כרגע אינו מאפשר להגדיר תיאור כזה עבור היפר-קישורים. אבל ב Microsoft Word, אתה יכול לעשות זאת באופן הבא:

alternate-descriptions-hyperlinks-mw

לפעמים יש בעיה שלא ניתן להגדיר טקסט חלופי עבור היפר-קישורים שנוצרו אוטומטית בתוכן העניינים (TOC) דרך Microsoft Word GUI. Aspose.Words יכול לעדכן שדות כאלה וליצור את הקישורים בכוחות עצמו.

עקוב אחר דוגמת הקוד כדי לעדכן שדות TOC באמצעות מודל אובייקט המסמך Aspose.Words (DOM):

auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
    LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->            
    LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });

for (const auto& link : tocHyperLinks)
    link->set_ScreenTip(link->get_DisplayResult());

auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);

auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);

כותרות טבלה

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

בטבלאות ב PDF/UA-1 המסמכים חייבים להיות כותרות-עמודה, שורה או שניהם. PDF/A דורש רק סימון טבלה רגיל, שאין לו מגבלות נוספות. שים לב ש Aspose.Words מייצר את סימון הטבלה הסטנדרטי באופן אוטומטי.

החלפת טקסט

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word המסמך אינו מאפשר למשתמשים להגדיר טקסט חלופי. אז זה צריך להיות מאומת קבוע בפלט PDF:

AcrobatReplacementText

קיצורים וראשי תיבות הרחבות

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word המסמך אינו מאפשר למשתמשים להגדיר קיצורים וראשי תיבות הרחבות. אז זה צריך להיות מאומת קבוע בפלט PDF:

AcrobatSplitAddExpansionText

כותרת המסמך

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
מסמך ב PDF/UA-1 צריך להיות בעל כותרת.

דרישות גופן

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

ישנם גם מספר ניואנסים של עבודה עם גופנים בעת המרה ל PDF/A-1, PDF/A-2, PDF/A-4 או PDF/UA-1 פורמטים באמצעות Aspose.Words. הם חייבים להילקח בחשבון אם אתה רוצה למנוע בעיות אפשריות עם מסמך הפלט.

הסעיפים שלהלן מתארים ניואנסים ואפשרויות כאלה לפתרונם.

דרישות משפטיות גופן

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words אינו מאמת את ההגבלות החוקיות של הגופנים המשומשים-זה תלוי במשתמשים. במילים אחרות, משתמש לא צריך לספק גופנים לא הולמים להמרה PDF באמצעות Aspose.Words.

.נוטדף Glyph

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

השימוש בגליף .notdef אסור. הגליף .notdef יופיע אם מסמך מכיל תווים שאינם קיימים בגופן שנבחר ואשר גם לא ניתן לפתור אותם באמצעות מנגנון החזרה של הגופן.

אזור שימוש פרטי (PUA)

PDF רמות תאימות סטנדרטיות בתוך Aspose.Words נוכחות של דרישה
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

תווים של אזור שימוש פרטי (PUA) מופיעים בעיקר עבור Windows גופן סמלי כמו “סמל”, “כנפיים”, “רשתות” ואחרים. Microsoft Word פורמטים אינם מספקים אפשרות לאחסן טקסט בפועל עבור תווים.

“סמל סגו UI” הוא גופן יוניקוד Windows שיכול לשמש כחלופה לגופנים סמליים.