استخراج الصور من PDF باستخدام Python

Contents
[ ]

استخدم مستند لفتح ملف PDF، ثم قم بالوصول إلى موارد الصفحة لاسترداد ملف صورة الكائن وحفظه كملف منفصل. هذا الأسلوب مفيد عندما تحتاج إلى إعادة استخدام الصور أو فحص الأصول المستخرجة أو إنشاء عمليات سير عمل معالجة الصور من محتوى PDF.

  1. افتح ملف PDF كملف Document.
  2. قم بالوصول إلى مورد الصورة من الصفحة المستهدفة.
  3. استرجع المطلوب XImage من مجموعة صور الصفحة.
  4. احفظ الصورة المستخرجة إلى ملف الإخراج.

    import aspose.pdf as apdf
    from io import FileIO
    from os import path

    path_infile = path.join(self.dataDir, infile)
    path_outfile = path.join(self.dataDir, outfile)

    document = apdf.Document(path_infile)
    xImage = document.pages[1].resources.images[1]
    with FileIO(path_outfile, "w") as output_image:
        xImage.save(output_image)