استخراج الصور من ملف PDF باستخدام Python

استخدم هذه الصفحة عندما تحتاج إلى إعادة استخدام الرسومات المضمنة أو أرشفة أصول الصور أو معالجة محتوى الصورة خارج PDF.

  1. قم بتحميل ملف PDF المصدر باستخدام ap.Document(infile).
  2. حدد الصفحة المستهدفة وفهرس موارد الصور.
  3. احفظ كائن الصورة إلى دفق الإخراج.
import aspose.pdf as ap
from io import FileIO


def extract_image(infile, outfile):
    document = ap.Document(infile)
    x_image = document.pages[1].resources.images[1]
    with FileIO(outfile, "wb") as output_image:
        x_image.save(output_image)

استخراج الصور من منطقة معينة في PDF

يستخرج هذا المثال الصور الموجودة داخل منطقة مستطيلة محددة على صفحة PDF ويحفظها كملفات منفصلة.

  1. قم بتحميل ملف PDF المصدر.
  2. ابتكر ImagePlacementAbsorber واقبلها على الصفحة المستهدفة.
  3. حدد المستطيل المستهدف.
  4. قم بالتكرار من خلال مواضع الصور وتحقق مما إذا كانت حدود كل صورة تتناسب مع المنطقة.
  5. احفظ الصور المتطابقة لإخراج الملفات.
import aspose.pdf as ap
from io import FileIO


def extract_image_from_specific_region(infile, outfile):
    document = ap.Document(infile)
    rectangle = ap.Rectangle(0, 0, 590, 590, True)
    absorber = ap.ImagePlacementAbsorber()
    document.pages[1].accept(absorber)

    index = 1
    for image_placement in absorber.image_placements:
        point1 = ap.Point(image_placement.rectangle.llx, image_placement.rectangle.lly)
        point2 = ap.Point(image_placement.rectangle.urx, image_placement.rectangle.ury)

        if rectangle.contains(point1, True) and rectangle.contains(point2, True):
            with FileIO(outfile.replace("index", str(index)), "wb") as output_image:
                image_placement.image.save(output_image)
            index += 1

موضوعات الصور ذات الصلة