Bekerja dengan PDF/Aatau PDF/UA

Format PDF/A dan PDF/UA memberlakukan beberapa persyaratan terkait konten dokumen yang tidak dapat dipenuhi selama konversi otomatis dari dokumen dalam format Word menjadi PDF. Persyaratan ini harus diverifikasi dan dikoreksi baik dalam dokumen Word sebelum konversi atau dalam dokumen PDF setelah konversi untuk menghasilkan dokumen yang sepenuhnya sesuai dengan PDF/A dan PDF/UA.

Persyaratan dasar adalah untuk struktur atau font dokumen PDF/A dan PDF/UA, yang akan kita bahas di bagian berikut.

Persyaratan Struktur Dokumen

Persyaratan saat ini adalah untuk PDF/A-1a, PDF/A-2a, PDF/A-4, dan format PDF/UA-1.

Ada beberapa nuansa tentang cara kerja Aspose.Words saat mengonversi ke berbagai standar format PDF. Mereka harus diperhitungkan jika Anda ingin mendapatkan hasil yang diharapkan.

Subbagian di bawah ini menjelaskan nuansa cara kerja Aspose.Words saat mengonversi ke berbagai standar format PDF dan opsi untuk solusinya.

Tipe Struktur

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Dokumen PDF adalah urutan blok seperti judul, paragraf, tabel, dan lainnya. Blok-blok ini membentuk struktur dokumen-kuat atau lemah.

Struktur kuat dan lemah berlaku untuk PDF/A. dokumen Microsoft Word memiliki struktur yang lemah menurut desain, dan Aspose.Words membuat PDF dengan struktur yang lemah masing-masing dan juga menghasilkan judul sesuai dengan tingkat garis besar paragraf dalam dokumen sumber.

Untuk dokumen PDF/UA-1 dengan struktur yang lemah, nomor heading juga harus berurutan tanpa celah.

Untuk memastikan keluaran yang benar, pengguna harus memastikan bahwa konten dokumen sumber diatur dengan benar dan tingkat kerangka ditentukan dengan benar untuk paragraf. Jika tidak, pengguna harus memverifikasi dan memperbaiki struktur dokumen keluaran PDF.

Menandai Konten sebagai Artefak

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Saat ini, Aspose.Words menandai header dan footer halaman, pemisah catatan, sel header tabel berulang, dan gambar dekoratif sebagai artefak. Perhatikan bahwa daftar ini dapat diperbarui di masa mendatang.

Jika dokumen berisi konten lain yang harus ditandai sebagai artefak, atau jika salah satu konten artefak adalah konten asli, pelanggan harus memperbaikinya di output PDF.

Spesifikasi Bahasa Alami

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Bahasa teks ditentukan dalam dokumen Microsoft Word. Aspose.Words mengekspor bahasa yang ditentukan ke keluaran PDF dengan atribut Lang yang dilampirkan ke urutan konten yang ditandai atau tag Rentang-ini dikendalikan oleh properti ExportLanguageToSpanTag. Umumnya tidak ada masalah bahasa saat teks dimasukkan oleh pengguna melalui Microsoft Word. Namun ada kemungkinan bahasanya mungkin tidak akurat jika teks dibuat secara otomatis.

Keterangan Gambar

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word dokumen memungkinkan pengguna untuk menambahkan keterangan gambar.

Saat ini Aspose.Words tidak dapat mengekspor teks dengan tag Teks, jadi teks tersebut harus ditandai di output PDF.

Deskripsi Alternatif

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word dokumen memungkinkan pengguna menambahkan teks alternatif ke gambar, bentuk, dan tabel. Aspose.Words mengekspor teks alternatif tersebut ke keluaran PDF.

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Selain poin sebelumnya, dokumen Microsoft Word juga memungkinkan pengguna menambahkan teks alternatif ke hyperlink. Aspose.Words mengekspor teks alternatif tersebut ke keluaran PDF.

Sayangnya, tidak semua aplikasi memungkinkan Anda menyiapkan deskripsi alternatif. Misalnya, Adobe Acrobat saat ini tidak memungkinkan untuk menyiapkan deskripsi seperti itu untuk hyperlink. Tetapi dalam Microsoft Word, Anda dapat melakukannya sebagai berikut:

alternate-descriptions-hyperlinks-mw

Terkadang ada masalah bahwa tidak mungkin menyetel teks alternatif untuk hyperlink yang dibuat secara otomatis dalam daftar isi (TOC) melalui Microsoft Word GUI. Aspose.Words dapat memperbarui bidang tersebut dan membuat tautannya sendiri.

Ikuti contoh kode untuk memperbarui bidang TOC menggunakan Model Objek Dokumen Aspose.Words (DOM):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

Header Tabel

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Tabel dalam dokumen PDF/UA-1 harus memiliki header-kolom, baris, atau keduanya. PDF/A hanya memerlukan markup tabel standar, yang tidak memiliki batasan tambahan. Perhatikan bahwa Aspose.Words menghasilkan markup tabel standar secara otomatis.

Teks Pengganti

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word dokumen tidak mengizinkan pengguna menyetel teks pengganti. Jadi ini perlu diverifikasi dan diperbaiki dalam output PDF:

AcrobatReplacementText

Singkatan dan Akronim Ekspansi

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word dokumen tidak mengizinkan pengguna untuk mengatur perluasan singkatan dan akronim. Jadi ini perlu diverifikasi dan diperbaiki dalam output PDF:

AcrobatSplitAddExpansionText

Judul Dokumen

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
Dokumen dalam PDF/UA-1 harus memiliki judul.

Persyaratan Fonta

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Ada juga sejumlah nuansa bekerja dengan font saat mengonversi ke PDF/A-1, PDF/A-2, PDF/A-4 atau format PDF/UA-1 menggunakan Aspose.Words. Mereka harus diperhitungkan jika Anda ingin menghindari kemungkinan masalah dengan dokumen keluaran.

Bagian di bawah ini menjelaskan nuansa dan opsi seperti itu untuk solusinya.

Persyaratan Hukum Font

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words tidak memverifikasi batasan hukum dari font yang digunakan-terserah pengguna. Dengan kata lain, pengguna tidak boleh menyediakan font yang tidak sesuai untuk konversi PDF menggunakan Aspose.Words.

.notdef Glyph

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Penggunaan mesin terbang .notdef dilarang. Mesin terbang .notdef akan muncul jika dokumen berisi karakter yang tidak ada dalam font yang dipilih dan yang juga tidak dapat diselesaikan melalui mekanisme Fallback Font.

Area Penggunaan Pribadi (PUA)

PDF tingkat kepatuhan standar dalam Aspose.Words Adanya persyaratan
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

Karakter Private Use Area (PUA) sebagian besar muncul untuk font simbolik Windows seperti “Symbol”, “Wingdings”, “Webdings”, dan lainnya. Format Microsoft Word tidak menyediakan opsi untuk menyimpan teks aktual untuk karakter.

“Segoe UI Symbol” adalah font Unicode Windows yang dapat digunakan sebagai alternatif font simbolik.