ทํางานร่วมกับ PDF/A หรือ PDF/UA

รูปแบบ PDF/A และ PDF/ UA บังคับใช้ความต้องการต่าง ๆ ที่เกี่ยวกับเนื้อหาเอกสาร ซึ่งไม่สามารถเติมเต็มได้ระหว่างการแปลงอัตโนมัติจากเอกสารในรูปแบบคํา PDF ควรตรวจสอบและแก้ไขความต้องการเหล่านี้ ในเอกสารคําก่อนการแปลง หรือในเอกสาร PDF หลังจากการแปลงแล้ว เพื่อสร้างเอกสาร PDF/A และ PDF/UA ที่เข้ากันได้อย่างเต็มที่

ความต้องการพื้นฐานสําหรับโครงสร้างหรือแบบอักษรของเอกสาร PDF/A และ PDF/UA ซึ่งเราจะพิจารณาในส่วนต่อไปนี้

เงื่อนไขโครงสร้างของเอกสาร

คุณสมบัติปัจจุบันสําหรับ PDF/A-1a, PDF/A-2a, PDF/A-4, และ PDF/UA-1

มีความแตกต่างบางอย่างของวิธีการ Aspose.Words ทํางานเมื่อแปลงเป็นมาตรฐานรูปแบบ PDF ต่างๆ พวก เขา ต้อง คํานึง ถึง เรื่อง นี้ หาก คุณ ต้องการ ได้ ผล ตาม ที่ คาด หมาย ไว้.

ส่วน ย่อย ที่ อยู่ ข้าง ล่าง นี้ อธิบาย ราย ละเอียด ต่าง ๆ ของ วิธี ที่ Aspose.Words ทํางานเมื่อแปลงเป็นมาตรฐานและตัวเลือกต่าง ๆ ของรูปแบบ PDF สําหรับการแก้ปัญหา

ชนิดโครงสร้าง

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1 tick

เอกสาร PDF เป็น ลําดับ ของ บล็อก ต่าง ๆ เช่น หัว เรื่อง, วรรค, ตาราง, และ อื่น ๆ. บล็อกเหล่านี้ประกอบเป็นโครงสร้างเอกสาร - หนักหรืออ่อนแอ

โครงสร้างทั้งแข็งแรงและอ่อนแอ ใช้ได้กับ PDF/A Microsoft Word เอกสารมีโครงสร้างอ่อนแอตามการออกแบบ Aspose.Words สร้าง PDF พร้อม ด้วย โครง สร้าง ที่ อ่อนแอ ตาม ลําดับ และ ยัง สร้าง หัว เรื่อง ตาม ลําดับ วรรค ต่าง ๆ ใน เอกสาร ต้น ฉบับ.

สําหรับเอกสาร PDF/UA-1 ที่มีโครงสร้างอ่อนแอ นอกจากนี้ ยังต้องใช้หมายเลขหัวพิมพ์ตามลําดับโดยไม่มีช่องว่าง

เพื่อ รับ ประกัน การ ส่ง ออก อย่าง ถูก ต้อง ผู้ ใช้ ต้อง ตรวจ ดู ให้ แน่ ใจ ว่า เนื้อ ความ ใน เอกสาร ที่ มา จาก แหล่ง นั้น มี การ จัด ระเบียบ อย่าง เหมาะ สม และ กําหนด ระดับ เส้น รอบ นอก อย่าง ถูก ต้อง สําหรับ วรรค. มิฉะนั้น ผู้ใช้ควรจะตรวจสอบและแก้ไขโครงสร้างของเอกสาร PDF ที่ส่งออก

การ ระบุ เนื้อหา ว่า เป็น ศิลปะ

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1 tick

ตอนนี้ Aspose.Words ทําเครื่องหมายหัวกระดาษและท้ายกระดาษ, ตัวแบ่งโน้ต, เซลล์หัวกระดาษซ้ํา, และภาพบนตารางเป็นวัตถุ ข้อ ควร จํา

หากเอกสารบรรจุเนื้อหาอื่น ๆ ที่ควรจะกําหนดให้เป็นสิ่งประดิษฐ์ หรือถ้าใด ๆ ของเนื้อหาที่เป็นสิ่งประดิษฐ์เป็นเนื้อหาจริง ลูกค้าควรจะแก้ไขดังกล่าวใน PDF ผลลัพธ์

การ กําหนด ภาษา ธรรมชาติ

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1 tick

ภาษาข้อความระบุใน Microsoft Word เอกสาร Aspose.Words ส่งออกภาษาที่ระบุไปยัง PDF เพื่อส่งออกด้วย Lang แอตทริบิวต์ที่แนบมากับลําดับสัญลักษณ์ หรือแท็ก parn - มันถูกควบคุมโดย ExportLanguageToSpanTag ทรัพย์สิน โดยทั่วไปแล้ว จะไม่มีการใช้ภาษา เมื่อมีการป้อนข้อความผ่านทางผู้ใช้ Microsoft Word. แต่ มี ทาง เป็น ไป ได้ ที่ ภาษา นั้น อาจ ไม่ ถูก ต้อง หาก มี การ สร้าง ข้อ ความ นั้น โดย อัตโนมัติ.

คําบรรยายภาพ

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-2a
PDF/ UA-1 tick

Microsoft Word เอกสารอนุญาตให้ผู้ใช้ทําการเพิ่มคําบรรยายภาพได้

ปัจจุบัน Aspose.Words ไม่สามารถส่งออกคําบรรยายภาพด้วยป้ายคําบรรยายภาพได้ ดังนั้นมันจะต้องถูกตั้งสถานะไว้ใน PDF ที่ส่งออก

คําอธิบายอื่น ๆ

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1 tick

Microsoft Word เอกสารอนุญาตให้ผู้ใช้ทําการเพิ่มข้อความใหม่ไปยังภาพ, รูปทรง, และตารางได้ Aspose.Words ส่งออกข้อความอื่น ๆ ไปยัง PDF

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-2a
PDF/ UA-1 tick

นอกจากจุดที่แล้ว Microsoft Word เอกสารยังช่วยให้ผู้ใช้ทําการเพิ่มข้อความอื่นไปยังไฮเปอร์ลิงก์ได้ Aspose.Words ส่งออกข้อความอื่น ๆ ไปยัง PDF

แต่โชคร้าย ที่ไม่ใช่ทุกโปรแกรม ที่ช่วยให้คุณสามารถตั้งค่ารายละเอียดอื่นได้ ยกตัวอย่างเช่น Adobe Acrobat ปัจจุบันไม่สามารถตั้งค่ารายละเอียดดังกล่าวสําหรับ ไฮเปอร์ลิงก์ได้ แต่ใน Microsoft Word, คุณสามารถทําเช่นนี้ดังต่อไปนี้:

alternate-descriptions-hyperlinks-mw

บางครั้งมีปัญหาที่ไม่สามารถตั้งค่าข้อความ allt สําหรับ ไฮเปอร์ลิงก์อัตโนมัติในตารางเนื้อหา (TOC) ผ่าน Microsoft Word GUI. Aspose.Words สามารถปรับปรุงพื้นที่ดังกล่าว และสร้างลิงก์ด้วยตัวเอง

ทําตามตัวอย่างโค้ดเพื่อปรับปรุง TOC ช่องข้อมูลโดยใช้ Aspose.Words Document Object Model (DOM)

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

หัวจดหมาย

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-2a
PDF/ UA-1 tick

ตารางในเอกสาร PDF/UA-1 ต้องมีส่วนหัว - คอลัมน์, แถว, หรือทั้งสองอย่าง PDF/A ต้องการเฉพาะเครื่องหมายตารางมาตรฐานเท่านั้น ซึ่งไม่มีข้อจํากัดเพิ่มเติม สังเกตว่า Aspose.Words สร้างการทําเครื่องหมายตารางมาตรฐานโดยอัตโนมัติ

ข้อความแทนที่

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1

Microsoft Word เอกสารไม่อนุญาตให้ผู้ใช้ตั้งค่าข้อความแทนที่ ดังนั้น ต้องตรวจสอบและแก้ไขใน PDF ผลส่งออก:

AcrobatReplacementText

การ เพิ่ม พูน และ การ ขยาย พันธุ์

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-2a tick
PDF/ UA-1

Microsoft Word เอกสารไม่อนุญาตให้ผู้ใช้ตั้งค่าการเกิดขึ้นอีกและการย่อส่วนขยาย ดังนั้น ต้องตรวจสอบและแก้ไขใน PDF ผลส่งออก:

AcrobatSplitAddExpansionText

ชื่อเอกสาร

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-2a
PDF/ A-4
PDF/ UA-1 tick
เอกสารใน PDF/ UA-1 ควรมีชื่อเรื่อง

กําหนดแบบอักษร

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-1b tick
PDF/ A-2a tick
PDF/ A-2b tick
PDF/ A-4 tick
PDF/ UA-1 tick

ยังมีความแตกต่างต่าง ๆ ของการทํางานร่วมกับแบบอักษรเมื่อแปลงเป็น PDF/A-1, PDF/A-2, PDF/A-4 หรือ PDF/UA-1 โดยใช้ Aspose.Words. เอกสาร เหล่า นี้ ต้อง มี การ พิจารณา หาก คุณ ต้องการ หลีก เลี่ยง ปัญหา ที่ อาจ เกิด ขึ้น ได้ กับ เอกสาร ที่ ส่ง ออก.

ส่วน ต่าง ๆ ข้าง ล่าง นี้ อธิบาย ถึง ความ แตก ต่าง และ ทาง เลือก ต่าง ๆ สําหรับ วิธี แก้.

ข้อ กําหนด ทาง กฎหมาย ของ แบบอักษร

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a tick
PDF/ A-1b tick
PDF/ A-2a tick
PDF/ A-2b tick
PDF/ A-4 tick
PDF/ UA-1 tick

Aspose.Words ไม่สามารถตรวจสอบข้อจํากัดทางกฎหมายของแบบอักษรที่ใช้ไป ขึ้นอยู่กับผู้ใช้ หรือพูดอีกอย่างคือ ผู้ใช้ไม่ควรจะให้แบบอักษรที่ไม่เหมาะสมสําหรับการแปลงแบบ PDF Aspose.Words.

…ไม่ป้องกัน Glyph

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-1b
PDF/ A-2a tick
PDF/ A-2b tick
PDF/ A-4 tick
PDF/ UA-1 tick

การใช้งานของ .notdef glyph ห้ามเข้า เดอะ .notdef glyph จะปรากฏหากเอกสารมีอักขระอยู่ด้วย ซึ่งไม่ได้อยู่ในแบบอักษรที่เลือกไว้ และไม่สามารถแก้ไขได้โดยผ่านทางกลไกการถอยกลับแบบอักษร

ใช้พื้นที่ส่วนตัว (PUA)

ระดับการตามมาตรฐาน PDF ภายใน Aspose.Words การนําเสนอความต้องการ
PDF/ A-1a
PDF/ A-1b
PDF/ A-2a tick
PDF/ A-2b tick
PDF/ A-4 tick
PDF/ UA-1

ใช้พื้นที่ส่วนตัว (PUA) อักขระส่วนใหญ่จะปรากฎสําหรับ Windows แบบอักษรสัญลักษณ์เช่น “ซิมโบล์”, “วินดิง”, “เว็บดิงส์”, และอื่นๆ Microsoft Word ฟอร์แมตไม่ได้ให้ตัวเลือกในการจัดเก็บข้อความจริงสําหรับอักขระ

“Siene UI Sign” คือ Windows แบบอักษรยูนิโค้ดซึ่งสามารถใช้เป็นตัวเลือกแทนแบบอักษรแบบสัญลักษณ์