PDF/A

Format PDF / A dan PDF / U memaksakan beberapa persyaratan yang terkait dengan konten dokumen yang tidak dapat dipenuhi selama konversi otomatis dari dokumen dalam format Word ke PDF. Persyaratan ini harus diverifikasi dan dikoreksi baik dalam dokumen Word sebelum konversi atau dalam dokumen PDF setelah konversi untuk menghasilkan dokumen sesuai PDF / A dan PDF / U.

Persyaratan dasar untuk struktur atau font dokumen PDF/A dan PDF/UA, yang akan kami pertimbangkan di bagian berikut.

Persyaratan Struktur Dokumen

Persyaratan saat ini adalah untuk format PDF / A-1a, PDF / A-2a, PDF / A-4, dan PDF / U-1.

Ada beberapa nuansa bagaimana Aspose.Words bekerja ketika mengkonversi ke berbagai standar format PDF. Mereka harus diperhitungkan jika Anda ingin mendapatkan hasil yang diharapkan.

Bagian bawah ini menjelaskan nuansa bagaimana Aspose.Words bekerja ketika mengkonversi ke berbagai standar dan opsi format PDF untuk solusi mereka.

Jenis Struktur

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1 tick

Dokumen PDF adalah urutan blok seperti judul, paragraf, tabel, dan lain-lain. Blok ini membentuk struktur dokumen - sangat atau lemah.

Struktur yang kuat dan lemah berlaku untuk PDF / A. Microsoft Word dokumen memiliki struktur yang lemah dengan desain, dan Aspose.Words membuat PDF dengan struktur yang lemah masing-masing dan juga menghasilkan judul sesuai dengan tingkat garis besar paragraf dalam dokumen sumber.

Untuk dokumen PDF/UA-1 dengan struktur yang lemah, ini juga diperlukan bahwa nomor judul masuk tanpa celah.

Untuk memastikan output yang benar, pengguna harus memastikan bahwa konten dokumen sumber diatur dengan benar dan tingkat garis ditentukan dengan benar untuk paragraf. Jika tidak, pengguna harus memverifikasi dan memperbaiki struktur dokumen PDF output.

Menandai Konten sebagai Artief

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1 tick

Saat ini, Aspose.Words menandai header halaman dan footer, pemisah catatan, sel header tabel berulang, dan gambar dekoratif sebagai artefak. Perhatikan bahwa daftar ini dapat diperbarui di masa depan.

Jika dokumen berisi konten lain yang harus ditandai sebagai artefak, atau jika ada konten yang artefak adalah konten nyata, pelanggan harus memperbaiki bahwa dalam PDF output.

Spesifikasi Bahasa Alam

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1 tick

Bahasa teks ditentukan dalam Microsoft Word dokumen. Aspose.Words ekspor bahasa yang ditentukan ke PDF output dengan Lang atribut yang melekat pada urutan yang ditandai atau tag Span - dikontrol oleh ExportLanguageToSpanTag Login Umumnya tidak ada masalah bahasa ketika teks dimasukkan oleh pengguna melalui Microsoft WordSitemap Tapi ada kemungkinan bahwa bahasa mungkin tidak akurat jika teks dihasilkan secara otomatis.

Gambar Caption

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
PDF/UA-1 tick

Microsoft Word dokumen memungkinkan pengguna untuk menambahkan keterangan gambar.

Sitemap Aspose.Words tidak dapat mengekspor caption dengan tag Caption, sehingga mereka harus ditandai di PDF output.

Alternate Deskripsi

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1 tick

Microsoft Word dokumen memungkinkan pengguna untuk menambahkan teks alternatif ke gambar, bentuk, dan tabel. Aspose.Words ekspor teks alternatif ke PDF output.

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
PDF/UA-1 tick

Selain titik sebelumnya, Microsoft Word dokumen juga memungkinkan pengguna untuk menambahkan teks alternatif ke hyperlink. Aspose.Words ekspor teks alternatif ke PDF output.

Sayangnya, tidak setiap aplikasi memungkinkan Anda untuk mengatur deskripsi alternatif. Sitemap Adobe Acrobat saat ini tidak memungkinkan untuk mengatur deskripsi tersebut untuk hyperlink. Login Microsoft Word, Anda dapat melakukan ini sebagai berikut:

alternate-descriptions-hyperlinks-mw

Kadang-kadang ada masalah yang tidak mungkin untuk mengatur teks alt untuk hyperlink autogenerasi di tabel konten (TOC) melalui Microsoft Word Login Aspose.Words dapat memperbarui bidang tersebut dan menghasilkan tautan sendiri.

Ikuti contoh kode untuk memperbarui TOC kolom menggunakan Aspose.Words Document Object Model SitemapDOMSitemap

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

Kepala Meja

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
PDF/UA-1 tick

Tabel dalam dokumen PDF/UA-1 harus memiliki header – kolom, baris, atau keduanya. PDF / Satu-satunya memerlukan markup tabel standar, yang tidak memiliki batasan tambahan. Login Aspose.Words menghasilkan markup tabel standar secara otomatis.

Penggantian Teks

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1

Microsoft Word dokumen tidak memungkinkan pengguna untuk mengatur teks pengganti. Jadi ini perlu diverifikasi dan tetap di PDF output:

AcrobatReplacementText

Akronim dan Akronisasi Ekspansi

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
PDF/UA-1

Microsoft Word dokumen tidak memungkinkan pengguna untuk mengatur singkatan dan ekspansi akronim. Jadi ini perlu diverifikasi dan tetap di PDF output:

AcrobatSplitAddExpansionText

Judul Dokumen

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
Datasheet PDF
PDF/UA-1 tick
Dokumen di PDF/UA-1 harus memiliki judul

Persyaratan Font

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
PDF/UA-1 tick

Ada juga sejumlah nuansa bekerja dengan font ketika mengkonversi ke PDF / A-1, PDF / A-2, format PDF / A-4 atau PDF / U-1 menggunakan Aspose.WordsSitemap Mereka harus diperhitungkan jika Anda ingin menghindari kemungkinan masalah dengan dokumen output.

Bagian di bawah ini menjelaskan nuansa dan pilihan tersebut untuk solusi mereka.

Persyaratan Hukum Font

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
PDF/UA-1 tick

Aspose.Words tidak memverifikasi pembatasan hukum dari font yang digunakan - itu hingga pengguna. Dengan kata lain, pengguna tidak boleh memberikan font yang tidak pantas untuk konversi PDF menggunakan Aspose.WordsSitemap

.Login Glyph

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
PDF/UA-1 tick

Penggunaan .notdef glyph dilarang. Login .notdef glyph akan muncul jika dokumen berisi karakter yang tidak hadir dalam font yang dipilih dan yang juga tidak dapat diselesaikan melalui mekanisme Font Fallback.

Area Penggunaan Pribadi (PUA)

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
Datasheet PDF
Datasheet PDF tick
Datasheet PDF tick
Datasheet PDF tick
PDF/UA-1

Personal Use Area (PUA) karakter muncul sebagian besar untuk Windows font simbolik seperti “Symbol”, “Wingdings”, “Webdings”, dan lain-lain. Microsoft Word format tidak memberikan pilihan untuk menyimpan teks aktual untuk karakter.

“Segoe UI Simbol” adalah Windows Unicode font yang bisa digunakan sebagai alternatif untuk font simbolik.