PDF에서 이미지 추출

PDF 문서의 각 페이지는 리소스(이미지, 양식 및 글꼴)를 포함하고 있습니다. getResources 메서드를 호출하여 이러한 리소스에 접근할 수 있습니다. Resources 클래스는 XImageCollection을 포함하고 있으며, getImages 메서드를 호출하여 이미지 목록을 얻을 수 있습니다.

따라서 페이지에서 이미지를 추출하려면 페이지, 다음으로 페이지 리소스, 마지막으로 이미지 컬렉션에 대한 참조를 얻어야 합니다.

특정 이미지는 예를 들어 인덱스를 통해 추출할 수 있습니다.

The image’s index returns an XImage object. This object provides a Save method which can be used to save the extracted image. The following code snippet shows how to extract images from a PDF file.

public void extractImage () {
       // 문서 열기
       try {
           document=new Document(inputStream);
       } catch (Exception e) {
           resultMessage.setText(e.getMessage());
           return;
       }

       com.aspose.pdf.Page page=document.getPages().get_Item(1);
       com.aspose.pdf.XImageCollection xImageCollection=page.getResources().getImages();
       // 특정 이미지 추출
       com.aspose.pdf.XImage xImage=xImageCollection.get_Item(1);
       File file=new File(fileStorage, "extracted-image.jpeg");
       try {
           java.io.FileOutputStream outputImage=new java.io.FileOutputStream(file.toString());
           // 출력 이미지 저장
           xImage.save(outputImage, ImageType.getJpeg());
           outputImage.close();
       } catch (java.io.IOException e) {
           resultMessage.setText(e.getMessage());
           return;
       }
       resultMessage.
         }

PDF에서 텍스트 추출 PDF에서 테이블 데이터 추출