Ekstrak Gambar dari PDF menggunakan Python
Contents
[
Hide
]
Gunakan Document untuk membuka PDF, kemudian mengakses sumber daya halaman untuk mengambil sebuah XImage objek dan simpan sebagai file terpisah. Pendekatan ini berguna ketika Anda perlu menggunakan ulang gambar, memeriksa aset yang diekstrak, atau membangun alur kerja pemrosesan gambar dari konten PDF.
- Buka PDF sebagai
Document. - Akses sumber daya gambar dari halaman target.
- Ambil yang diperlukan
XImagedari koleksi gambar halaman. - Simpan gambar yang diekstrak ke file output.
import aspose.pdf as apdf
from io import FileIO
from os import path
path_infile = path.join(self.dataDir, infile)
path_outfile = path.join(self.dataDir, outfile)
document = apdf.Document(path_infile)
xImage = document.pages[1].resources.images[1]
with FileIO(path_outfile, "w") as output_image:
xImage.save(output_image)