Ekstrak Gambar dari PDF
Contents
[
Hide
]
Setiap halaman dalam dokumen PDF mengandung sumber daya (gambar, formulir, dan font). Kita dapat mengakses sumber daya ini dengan memanggil metode getResources. Kelas Resources mengandung XImageCollection dan kita dapat mendapatkan daftar gambar dengan memanggil metode getImages.
Jadi untuk mengekstrak gambar dari halaman, kita perlu mendapatkan referensi ke halaman, selanjutnya ke sumber daya halaman dan terakhir ke koleksi gambar. Gambar tertentu dapat kita ekstrak misalnya dengan indeks.
Indeks gambar mengembalikan objek XImage. This object menyediakan metode save yang dapat digunakan untuk menyimpan gambar yang diekstraksi. Cuplikan kode berikut menunjukkan cara mengekstraksi gambar dari file PDF.
// Memuat dokumen PDF
$document = new Document($inputFile);
// Mendapatkan halaman pertama dari dokumen
$page = $document->getPages()->get_Item(1);
// Mendapatkan koleksi gambar pada halaman
$xImageCollection = $page->getResources()->getImages();
// Mendapatkan gambar pertama dari koleksi
$xImage = $xImageCollection->get_Item(1);
// Membuat objek FileOutputStream baru untuk menyimpan gambar
$outputImage = new java("java.io.FileOutputStream", $outputFile);
// Menyimpan gambar ke file output
$xImage->save($outputImage);
// Menutup file gambar output
$outputImage->close();