Bekerja dengan PDF/A atau PDF/UA

Format PDF/A dan PDF/UA memberlakukan beberapa persyaratan terkait konten dokumen yang tidak dapat dipenuhi selama konversi otomatis dari dokumen dalam format Word ke PDF. Persyaratan ini harus diverifikasi dan diperbaiki baik dalam dokumen Word sebelum konversi atau dalam dokumen PDF setelah konversi untuk menghasilkan dokumen yang sepenuhnya sesuai PDF/A dan PDF/UA.

Persyaratan dasar adalah untuk struktur atau font dokumen PDF/A dan PDF/UA, yang akan kita pertimbangkan di bagian berikut.

Persyaratan Struktur Dokumen

Persyaratan saat ini adalah untuk format PDF/A-1a, PDF/A-2a, PDF/A-4, dan PDF/UA-1.

Ada beberapa perbedaan dalam cara kerja Aspose.Words saat mengonversi ke berbagai standar format PDF. Mereka harus diperhitungkan jika Anda ingin mendapatkan hasil yang diharapkan.

Subbagian di bawah ini menjelaskan perbedaan cara kerja Aspose.Words saat mengonversi ke berbagai standar format PDF dan opsi untuk solusinya.

Tipe Struktur

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Dokumen PDF merupakan rangkaian blok seperti judul, paragraf, tabel, dan lain-lain. Blok-blok ini membentuk struktur dokumen – kuat atau lemah.

Struktur kuat dan lemah keduanya valid untuk PDF/A. Dokumen Microsoft Word memiliki struktur yang lemah berdasarkan desain, dan Aspose.Words membuat PDF dengan struktur yang lemah dan juga menghasilkan judul sesuai dengan tingkat garis besar paragraf dalam dokumen sumber.

Untuk dokumen PDF/UA-1 dengan struktur yang lemah, nomor judul juga harus diurutkan tanpa celah.

Untuk memastikan keluaran yang benar, pengguna harus memastikan bahwa konten dokumen sumber diatur dengan benar dan tingkat kerangka paragraf ditentukan dengan benar. Jika tidak, pengguna harus memverifikasi dan memperbaiki struktur dokumen PDF keluaran.

Menandai Konten sebagai Artefak

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Saat ini, Aspose.Words menandai header dan footer halaman, pemisah catatan, sel header tabel berulang, dan gambar dekoratif sebagai artefak. Perhatikan bahwa daftar ini mungkin diperbarui di masa mendatang.

Jika dokumen berisi konten lain yang harus ditandai sebagai artefak, atau jika konten artefak tersebut merupakan konten asli, pelanggan harus memperbaikinya di PDF keluaran.

Spesifikasi Bahasa Alami

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Bahasa teks ditentukan dalam dokumen Microsoft Word. Aspose.Words mengekspor bahasa tertentu ke PDF keluaran dengan atribut Lang yang dilampirkan ke urutan konten yang ditandai atau tag Span – ini dikontrol oleh properti ExportLanguageToSpanTag. Secara umum tidak ada masalah bahasa ketika teks dimasukkan oleh pengguna melalui Microsoft Word. Namun ada kemungkinan bahasanya tidak akurat jika teks dibuat secara otomatis.

Keterangan Gambar

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Dokumen Microsoft Word memungkinkan pengguna untuk menambahkan keterangan gambar.

Saat ini Aspose.Words tidak dapat mengekspor teks dengan tag Caption, sehingga harus ditandai di PDF keluaran.

Deskripsi Alternatif

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Dokumen Microsoft Word memungkinkan pengguna menambahkan teks alternatif ke gambar, bentuk, dan tabel. Aspose.Words mengekspor teks alternatif tersebut ke PDF keluaran.

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Selain poin sebelumnya, dokumen Microsoft Word juga memungkinkan pengguna menambahkan teks alternatif ke hyperlink. Aspose.Words mengekspor teks alternatif tersebut ke PDF keluaran.

Sayangnya, tidak semua aplikasi mengizinkan Anda mengatur deskripsi alternatif. Misalnya, Adobe Acrobat saat ini tidak memungkinkan pengaturan deskripsi hyperlink seperti itu. Namun di Microsoft Word, Anda dapat melakukannya sebagai berikut:

alternatif-deskripsi-hyperlink-mw

Terkadang ada masalah yang tidak memungkinkan untuk menyetel teks alternatif untuk hyperlink yang dibuat secara otomatis di daftar isi (TOC) melalui Microsoft Word GUI. Aspose.Words dapat memperbarui kolom tersebut dan membuat tautannya sendiri.

Ikuti contoh kode untuk memperbarui kolom TOC menggunakan Aspose.Words Document Object Model (DOM):

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

Header Tabel

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Tabel dalam dokumen PDF/UA-1 harus memiliki header – kolom, baris, atau keduanya. PDF/A hanya memerlukan markup tabel standar, yang tidak memiliki batasan tambahan. Perhatikan bahwa Aspose.Words menghasilkan markup tabel standar secara otomatis.

Teks Pengganti

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Dokumen Microsoft Word tidak mengizinkan pengguna mengatur teks pengganti. Jadi ini perlu diverifikasi dan diperbaiki dalam keluaran PDF:

Teks Pengganti Acrobat

Singkatan dan Perluasan Akronim

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Dokumen Microsoft Word tidak mengizinkan pengguna untuk mengatur singkatan dan perluasan akronim. Jadi ini perlu diverifikasi dan diperbaiki dalam keluaran PDF:

AcrobatSplitTambahkanExpansionText

Judul dokumen

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
Dokumen dalam PDF/UA-1 harus memiliki judul

Persyaratan Font

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Ada juga sejumlah nuansa dalam bekerja dengan font saat mengonversi ke format PDF/A-1, PDF/A-2, PDF/A-4 atau PDF/UA-1 menggunakan Aspose.Words. Mereka harus diperhitungkan jika Anda ingin menghindari kemungkinan masalah dengan dokumen keluaran.

Bagian di bawah ini menjelaskan nuansa dan opsi untuk solusinya.

Persyaratan Hukum Font

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words tidak memverifikasi batasan hukum font yang digunakan – terserah pengguna. Dengan kata lain, pengguna tidak boleh memberikan font yang tidak sesuai untuk konversi PDF menggunakan Aspose.Words.

.notdef Glyph

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Penggunaan .notdef glyph dilarang. .notdef glyph akan muncul jika dokumen berisi karakter yang tidak ada dalam font yang dipilih dan juga tidak dapat diselesaikan melalui mekanisme Font Fallback.

Area Penggunaan Pribadi (PUA)

Tingkat kepatuhan standar PDF dalam Aspose.Words Kehadiran persyaratan
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1

Karakter Area Penggunaan Pribadi (PUA) sebagian besar muncul untuk font simbolis Windows seperti “Simbol”, “Wingdings”, “Webdings”, dan lainnya. Format Microsoft Word tidak menyediakan opsi untuk menyimpan teks sebenarnya untuk karakter.

“Segoe UI Symbol” adalah font Windows Unicode yang dapat digunakan sebagai alternatif font simbolik.