Python을 사용하여 PDF 파일에서 이미지 추출

포함된 그래픽을 재사용하거나, 이미지 자산을 보관하거나, PDF 외부의 이미지 내용을 처리해야 하는 경우 이 페이지를 사용하십시오.

를 사용하여 소스 PDF를 로드합니다. ap.Document(infile).
대상 페이지 및 이미지 리소스 색인을 선택합니다.
이미지 객체를 출력 스트림에 저장합니다.

import aspose.pdf as ap
from io import FileIO


def extract_image(infile, outfile):
    document = ap.Document(infile)
    x_image = document.pages[1].resources.images[1]
    with FileIO(outfile, "wb") as output_image:
        x_image.save(output_image)

PDF의 특정 영역에서 이미지 추출

이 예제에서는 PDF 페이지의 지정된 사각형 영역 내에 있는 이미지를 추출하여 별도의 파일로 저장합니다.

원본 PDF를 로드합니다.
작성 ImagePlacementAbsorber 대상 페이지에서 수락하십시오.
대상 사각형을 정의합니다.
이미지 배치를 반복하여 각 이미지 경계가 영역에 맞는지 확인합니다.
일치하는 이미지를 출력 파일에 저장합니다.

import aspose.pdf as ap
from io import FileIO


def extract_image_from_specific_region(infile, outfile):
    document = ap.Document(infile)
    rectangle = ap.Rectangle(0, 0, 590, 590, True)
    absorber = ap.ImagePlacementAbsorber()
    document.pages[1].accept(absorber)

    index = 1
    for image_placement in absorber.image_placements:
        point1 = ap.Point(image_placement.rectangle.llx, image_placement.rectangle.lly)
        point2 = ap.Point(image_placement.rectangle.urx, image_placement.rectangle.ury)

        if rectangle.contains(point1, True) and rectangle.contains(point2, True):
            with FileIO(outfile.replace("index", str(index)), "wb") as output_image:
                image_placement.image.save(output_image)
            index += 1

Python을 사용하여 PDF 파일에서 이미지 추출

PDF의 특정 영역에서 이미지 추출

관련 이미지 주제