การทำงานกับPDF/AหรือPDF/UA

รูปแบบPDF/AและPDF/UAกำหนดข้อกำหนดหลายประการที่เกี่ยวข้องกับเนื้อหาเอกสารที่ไม่สามารถทำได้ในระหว่างการแปลงอัตโนมัติจากเอกสารในรูปแบบคำเป็นPDF เอกสารคำก่อนการแปลงหรือในเอกสารPDFหลังการแปลงเพื่อสร้างเอกสารที่สอดคล้องกันPDF/AและPDF/UA.

ข้อกำหนดพื้นฐานสำหรับโครงสร้างหรือแบบอักษรของเอกสารPDF/AและPDF/UAซึ่งเราจะพิจารณาในส่วนต่อไปนี้.

ข้อกำหนดโครงสร้างเอกสาร

ความต้องการในปัจจุบันสำหรับPDF/A-1a, PDF/A-2a, PDF/A-4, และPDF/UA-1รูปแบบ.

มีความแตกต่างบางอย่างของวิธีการทำงานAspose.Wordsเมื่อแปลงเป็นมาตรฐานรูปแบบต่างๆPDF จะต้องนำมาพิจารณาถ้าคุณต้องการที่จะได้รับผลที่คาดหวัง.

ส่วนย่อยด้านล่างอธิบายถึงความแตกต่างของวิธีทำงานAspose.Wordsเมื่อแปลงเป็นมาตรฐานรูปแบบPDFและตัวเลือกต่างๆสำหรับโซลูชัน.

ประเภทโครงสร้าง

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

เอกสารPDFเป็นลำดับของบล็อกเช่นส่วนหัวย่อหน้าตารางและอื่นๆ บล็อกเหล่านี้สร้างโครงสร้างเอกสาร-อย่างมากหรืออ่อนแอ.

โครงสร้างทั้งแข็งแรงและอ่อนแอใช้ได้สำหรับPDF/A Microsoft Wordเอกสารมีโครงสร้างที่อ่อนแอโดยการออกแบบและAspose.Wordsสร้างPDFด้วยโครงสร้างที่อ่อนแอตามลำ.

สำหรับเอกสารPDF/UA-1ที่มีโครงสร้างที่อ่อนแอจำเป็นต้องใช้หมายเลขหัวเรื่องตามลำดับโดยไม่มีช่องว่าง.

เพื่อให้แน่ใจว่าเอาต์พุตที่ถูกต้องผู้ใช้ต้องแน่ใจว่าเนื้อหาเอกสารต้นทางถูกจัดระเบียบอย่ มิฉะนั้นผู้ใช้ควรตรวจสอบและแก้ไขโครงสร้างของเอกสารที่ส่งออกPDF.

การทำเครื่องหมายเนื้อหาเป็นสิ่งประดิษฐ์

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

ในขณะนี้Aspose.Wordsทำเครื่องหมายส่วนหัวและท้ายกระดาษ,ตัวคั่นโน้ต,เซลล์ส่วนหัวของตารางที่ซ้ำกัน,และรูปภาพตกแต่งเป็นสิ่งประดิษฐ์. โปรดทราบว่ารายการนี้อาจมีการปรับปรุงในอนาคต.

หากเอกสารประกอบด้วยเนื้อหาอื่นๆที่ควรทำเครื่องหมายเป็นสิ่งประดิษฐ์หรือถ้าเนื้อหาที่ประดิษฐ์เป็นเนื้อหาจริงลูกค้าควรแก้ไขในเอาต์พุตPDF.

ข้อกำหนดภาษาธรรมชาติ

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

ภาษาข้อความที่ระบุไว้ในเอกสารMicrosoft Word Aspose.Wordsส่งออกภาษาที่ระบุไปยังเอาต์พุตPDFด้วยแอตทริบิวต์Langที่แนบมากับลำดับเนื้อหาที่ทำเครื่องหมายไว้หรือแท็กสแปน-มันถูกควบคุมโดยคุณสมบัติExportLanguageToSpanTag โดยทั่วไปไม่มีปัญหาภาษาเมื่อข้อความถูกป้อนโดยผู้ใช้ผ่านทางMicrosoft Word แต่มีความเป็นไปได้ว่าภาษาที่อาจจะไม่ถูกต้องถ้าข้อความที่ถูกสร้างขึ้นโดยอัตโนมัติ.

คำบรรยายภาพ

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Wordเอกสารอนุญาตให้ผู้ใช้เพิ่มคำอธิบายภาพ.

ขณะนี้Aspose.Wordsไม่สามารถส่งออกคำบรรยายด้วยแท็กคำบรรยายได้ดังนั้นจึงต้องถูกตั้งค่าสถานะในผลลัพธ์PDF.

คำอธิบายอื่น

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Wordเอกสารอนุญาตให้ผู้ใช้เพิ่มข้อความอื่นให้กับรูปภาพรูปร่างและตาราง Aspose.Wordsส่งออกข้อความอื่นไปยังผลลัพธ์PDF.

คำอธิบายอื่นสำหรับการเชื่อมโยงหลายมิติ

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

นอกจากจุดก่อนหน้านี้Microsoft Wordเอกสารยังอนุญาตให้ผู้ใช้เพิ่มข้อความอื่นในการเชื่อมโยงหลายมิติ Aspose.Wordsส่งออกข้อความอื่นไปยังผลลัพธ์PDF.

แต่น่าเสียดายที่ไม่ได้ทุกโปรแกรมช่วยให้คุณสามารถตั้งค่าคำอธิบายอื่น ตัวอย่างเช่นAdobe Acrobatขณะนี้ไม่ได้เปิดใช้งานการตั้งค่าคำอธิบายดังกล่าวสำหรับการเชื่อมโยงไ แต่ในMicrosoft Wordคุณสามารถทำเช่นนี้ดังต่อไปนี้:

alternate-descriptions-hyperlinks-mw

ในสารบัญ(TOC)ผ่านทางMicrosoft WordGUI Aspose.Wordsสามารถอัปเดตฟิลด์ดังกล่าวและสร้างการเชื่อมโยงด้วยตัวเอง.

ทำตามตัวอย่างรหัสเพื่อปรับปรุงTOCฟิลด์โดยใช้แบบจำลองวัตถุเอกสารAspose.Words(DOM):

auto doc = MakeObject<Document>(filename);
auto tocHyperLinks = doc->get_Range()->get_Fields()->
    LINQ_Where([](SharedPtr<Field> f) {return f->get_Type() == FieldType::FieldHyperlink; })->            
    LINQ_Where([](SharedPtr<FieldHyperlink> f) { return f->get_DisplayResult().StartsWith(u"#_Toc"); });

for (const auto& link : tocHyperLinks)
    link->set_ScreenTip(link->get_DisplayResult());

auto opt = MakeObject<PdfSaveOptions>();
opt->set_Compliance(PdfCompliance::PdfUa1);
opt->set_DisplayDocTitle(true);
opt->set_ExportDocumentStructure(true);
opt->get_OutlineOptions()->set_HeadingsOutlineLevels(3);
opt->get_OutlineOptions()->set_CreateMissingOutlineLevels(true);

auto outFile = filename.substr(0, filename.find_last_of('.')) + "_aw.pdf";
doc->Save(outFile, opt);

ส่วนหัวของตาราง

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

ตารางในPDF/UA-1เอกสารต้องมีส่วนหัว–คอลัมน์แถวหรือทั้งสองอย่าง PDF/Aต้องใช้มาร์กอัปตารางมาตรฐานซึ่งไม่มีข้อจำกัดเพิ่มเติม โปรดทราบว่าAspose.Wordsสร้างมาร์กอัปตารางมาตรฐานโดยอัตโนมัติ.

ข้อความแทนที่

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Wordเอกสารไม่อนุญาตให้ผู้ใช้ตั้งค่าข้อความแทนที่ ดังนั้นนี้จะต้องมีการตรวจสอบและแก้ไขในการส่งออกPDF:

AcrobatReplacementText

ตัวย่อและตัวย่อขยายตัว

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Wordเอกสารไม่อนุญาตให้ผู้ใช้ตั้งค่าการขยายตัวย่อและตัวย่อ ดังนั้นนี้จะต้องมีการตรวจสอบและแก้ไขในการส่งออกPDF:

AcrobatSplitAddExpansionText

ชื่อเอกสาร

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
เอกสารในPDF/UA-1ควรมีชื่อ.

ความต้องการแบบอักษร

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

นอกจากนี้ยังมีจำนวนของความแตกต่างของการทำงานกับแบบอักษรเมื่อแปลงเป็นPDF/A-1, PDF/A-2, PDF/A-4 หรือPDF/UA-1รูปแบบโดยใช้Aspose.Words พวกเขาจะต้องนำมาพิจารณาถ้าคุณต้องการหลีกเลี่ยงปัญหาที่เป็นไปได้กับเอกสารที่ส่งออ.

ส่วนด้านล่างอธิบายความแตกต่างดังกล่าวและตัวเลือกสำหรับการแก้ปัญหาของพวกเขา.

ข้อกำหนดทางกฎหมายแบบอักษร

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Wordsไม่ได้ตรวจสอบข้อจำกัดทางกฎหมายของแบบอักษรที่ใช้-มันขึ้นอยู่กับผู้ใช้ กล่าวอีกนัยหนึ่งผู้ใช้ไม่ควรให้แบบอักษรที่ไม่เหมาะสมสำหรับการแปลงPDFโดยใช้Aspose.Words.

.Glyph

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

ห้ามใช้สัญลักษณ์.notdef สัญลักษณ์.notdefจะปรากฏขึ้นหากเอกสารมีอักขระที่ไม่มีอยู่ในแบบอักษรที่เลือกและไม่สามารถแก้ไขได้ด้วยกลไกการย้อนกลับแบบอักษร.

พื้นที่ใช้ส่วนตัว(PUA)

PDFระดับการปฏิบัติตามมาตรฐานภายในAspose.Words ของความต้องการ
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

พื้นที่ใช้งานส่วนตัว(PUA)ส่วนใหญ่จะปรากฏสำหรับแบบอักษรสัญลักษณ์Windowsเช่น"สัญลักษณ์",“ปีก”,“เว็บดิ้ง"และอื่ Microsoft Wordรูปแบบไม่มีตัวเลือกในการจัดเก็บข้อความจริงสำหรับอักขระ.

“เซโกUIสัญลักษณ์"เป็นWindowsตัวอักษรยูนิโค้ดซึ่งสามารถนำมาใช้เป็นทางเลือกในการแบบอักษรสัญลั.