Ekstrak Konten Berlabel dari PDF

Dalam artikel ini Anda akan belajar cara mengekstrak konten berlabel dari dokumen PDF menggunakan C#.

Potongan kode berikut juga bekerja dengan pustaka Aspose.PDF.Drawing.

Mendapatkan Konten PDF Berlabel

Untuk mendapatkan konten dari Dokumen PDF dengan Teks Berlabel, Aspose.PDF menawarkan properti TaggedContent dari kelas Document.

Potongan kode berikut menunjukkan cara mendapatkan konten dari dokumen PDF dengan Teks Berlabel:

Mendapatkan Struktur Akar

Untuk mendapatkan struktur akar dari Dokumen PDF Berlabel, Aspose.PDF menawarkan properti StructTreeRootElement dari antarmuka ITaggedContent dan StructureElement. Potongan kode berikut menunjukkan cara mendapatkan struktur akar dari Dokumen PDF Berlabel:

Mengakses Elemen Anak

Untuk mengakses elemen anak dari Dokumen PDF Berlabel, Aspose.PDF menawarkan kelas ElementList. Potongan kode berikut menunjukkan cara mengakses elemen anak dari Dokumen PDF Berlabel:

Menandai Gambar dalam PDF yang Ada

Untuk menandai gambar dalam dokumen PDF yang ada, Aspose.PDF menawarkan metode FindElements dari kelas StructureElement. Anda dapat menambahkan teks alternatif untuk gambar menggunakan properti AlternativeText dari kelas FigureElement.

Potongan kode berikut menunjukkan cara menandai gambar dalam dokumen PDF yang ada: