Python을 사용하여 PDF에서 이미지 추출

Contents
[ ]

용도 문서 PDF를 연 다음 페이지 리소스에 액세스하여 검색하십시오. xImage 객체를 생성하고 별도의 파일로 저장합니다.이 방법은 이미지를 재사용하거나, 추출된 자산을 검사하거나, PDF 내용에서 이미지 처리 워크플로를 구축해야 할 때 유용합니다.

  1. PDF를 다음과 같이 엽니다. Document.
  2. 대상 페이지에서 이미지 리소스에 액세스합니다.
  3. 필요한 항목 검색 XImage 페이지 이미지 컬렉션에서
  4. 추출한 이미지를 출력 파일에 저장합니다.

    import aspose.pdf as apdf
    from io import FileIO
    from os import path

    path_infile = path.join(self.dataDir, infile)
    path_outfile = path.join(self.dataDir, outfile)

    document = apdf.Document(path_infile)
    xImage = document.pages[1].resources.images[1]
    with FileIO(path_outfile, "w") as output_image:
        xImage.save(output_image)