Ekstrak Gambar dari PDF menggunakan Python

Gunakan Document untuk membuka PDF, kemudian mengakses sumber daya halaman untuk mengambil sebuah XImage objek dan simpan sebagai file terpisah. Pendekatan ini berguna ketika Anda perlu menggunakan ulang gambar, memeriksa aset yang diekstrak, atau membangun alur kerja pemrosesan gambar dari konten PDF.

Buka PDF sebagai Document.
Akses sumber daya gambar dari halaman target.
Ambil yang diperlukan XImage dari koleksi gambar halaman.
Simpan gambar yang diekstrak ke file output.


    import aspose.pdf as apdf
    from io import FileIO
    from os import path

    path_infile = path.join(self.dataDir, infile)
    path_outfile = path.join(self.dataDir, outfile)

    document = apdf.Document(path_infile)
    xImage = document.pages[1].resources.images[1]
    with FileIO(path_outfile, "w") as output_image:
        xImage.save(output_image)

Ekstrak Teks dari PDF menggunakan Python Ekstrak Font dari PDF melalui Python