Python을 사용하여 PDF 파일에서 이미지 추출

포함된 그래픽을 재사용하거나, 이미지 자산을 보관하거나, PDF 외부의 이미지 내용을 처리해야 하는 경우 이 페이지를 사용하십시오.

  1. 를 사용하여 소스 PDF를 로드합니다. ap.Document(infile).
  2. 대상 페이지 및 이미지 리소스 색인을 선택합니다.
  3. 이미지 객체를 출력 스트림에 저장합니다.
import aspose.pdf as ap
from io import FileIO


def extract_image(infile, outfile):
    document = ap.Document(infile)
    x_image = document.pages[1].resources.images[1]
    with FileIO(outfile, "wb") as output_image:
        x_image.save(output_image)

PDF의 특정 영역에서 이미지 추출

이 예제에서는 PDF 페이지의 지정된 사각형 영역 내에 있는 이미지를 추출하여 별도의 파일로 저장합니다.

  1. 원본 PDF를 로드합니다.
  2. 작성 ImagePlacementAbsorber 대상 페이지에서 수락하십시오.
  3. 대상 사각형을 정의합니다.
  4. 이미지 배치를 반복하여 각 이미지 경계가 영역에 맞는지 확인합니다.
  5. 일치하는 이미지를 출력 파일에 저장합니다.
import aspose.pdf as ap
from io import FileIO


def extract_image_from_specific_region(infile, outfile):
    document = ap.Document(infile)
    rectangle = ap.Rectangle(0, 0, 590, 590, True)
    absorber = ap.ImagePlacementAbsorber()
    document.pages[1].accept(absorber)

    index = 1
    for image_placement in absorber.image_placements:
        point1 = ap.Point(image_placement.rectangle.llx, image_placement.rectangle.lly)
        point2 = ap.Point(image_placement.rectangle.urx, image_placement.rectangle.ury)

        if rectangle.contains(point1, True) and rectangle.contains(point2, True):
            with FileIO(outfile.replace("index", str(index)), "wb") as output_image:
                image_placement.image.save(output_image)
            index += 1

관련 이미지 주제