استخراج الصور من PDF باستخدام Python
Contents
[
Hide
]
استخدم مستند لفتح ملف PDF، ثم قم بالوصول إلى موارد الصفحة لاسترداد ملف صورة الكائن وحفظه كملف منفصل. هذا الأسلوب مفيد عندما تحتاج إلى إعادة استخدام الصور أو فحص الأصول المستخرجة أو إنشاء عمليات سير عمل معالجة الصور من محتوى PDF.
- افتح ملف PDF كملف
Document. - قم بالوصول إلى مورد الصورة من الصفحة المستهدفة.
- استرجع المطلوب
XImageمن مجموعة صور الصفحة. - احفظ الصورة المستخرجة إلى ملف الإخراج.
import aspose.pdf as apdf
from io import FileIO
from os import path
path_infile = path.join(self.dataDir, infile)
path_outfile = path.join(self.dataDir, outfile)
document = apdf.Document(path_infile)
xImage = document.pages[1].resources.images[1]
with FileIO(path_outfile, "w") as output_image:
xImage.save(output_image)