استخراج الصور من ملف PDF باستخدام Python
Contents
[
Hide
]
استخدم هذه الصفحة عندما تحتاج إلى إعادة استخدام الرسومات المضمنة أو أرشفة أصول الصور أو معالجة محتوى الصورة خارج PDF.
- قم بتحميل ملف PDF المصدر باستخدام
ap.Document(infile). - حدد الصفحة المستهدفة وفهرس موارد الصور.
- احفظ كائن الصورة إلى دفق الإخراج.
import aspose.pdf as ap
from io import FileIO
def extract_image(infile, outfile):
document = ap.Document(infile)
x_image = document.pages[1].resources.images[1]
with FileIO(outfile, "wb") as output_image:
x_image.save(output_image)
استخراج الصور من منطقة معينة في PDF
يستخرج هذا المثال الصور الموجودة داخل منطقة مستطيلة محددة على صفحة PDF ويحفظها كملفات منفصلة.
- قم بتحميل ملف PDF المصدر.
- ابتكر
ImagePlacementAbsorberواقبلها على الصفحة المستهدفة. - حدد المستطيل المستهدف.
- قم بالتكرار من خلال مواضع الصور وتحقق مما إذا كانت حدود كل صورة تتناسب مع المنطقة.
- احفظ الصور المتطابقة لإخراج الملفات.
import aspose.pdf as ap
from io import FileIO
def extract_image_from_specific_region(infile, outfile):
document = ap.Document(infile)
rectangle = ap.Rectangle(0, 0, 590, 590, True)
absorber = ap.ImagePlacementAbsorber()
document.pages[1].accept(absorber)
index = 1
for image_placement in absorber.image_placements:
point1 = ap.Point(image_placement.rectangle.llx, image_placement.rectangle.lly)
point2 = ap.Point(image_placement.rectangle.urx, image_placement.rectangle.ury)
if rectangle.contains(point1, True) and rectangle.contains(point2, True):
with FileIO(outfile.replace("index", str(index)), "wb") as output_image:
image_placement.image.save(output_image)
index += 1