PDF에서 이미지 추출
Contents
[
Hide
]
PDF 문서의 각 페이지는 리소스(이미지, 양식 및 글꼴)를 포함하고 있습니다. getResources 메서드를 호출하여 이러한 리소스에 접근할 수 있습니다. Resources 클래스는 XImageCollection을 포함하고 있으며, getImages 메서드를 호출하여 이미지 목록을 얻을 수 있습니다.
따라서 페이지에서 이미지를 추출하려면 페이지, 다음으로 페이지 리소스, 마지막으로 이미지 컬렉션에 대한 참조를 얻어야 합니다.
특정 이미지는 예를 들어 인덱스를 통해 추출할 수 있습니다.
The image’s index returns an XImage object. This object provides a Save method which can be used to save the extracted image. The following code snippet shows how to extract images from a PDF file.
public void extractImage () {
// 문서 열기
try {
document=new Document(inputStream);
} catch (Exception e) {
resultMessage.setText(e.getMessage());
return;
}
com.aspose.pdf.Page page=document.getPages().get_Item(1);
com.aspose.pdf.XImageCollection xImageCollection=page.getResources().getImages();
// 특정 이미지 추출
com.aspose.pdf.XImage xImage=xImageCollection.get_Item(1);
File file=new File(fileStorage, "extracted-image.jpeg");
try {
java.io.FileOutputStream outputImage=new java.io.FileOutputStream(file.toString());
// 출력 이미지 저장
xImage.save(outputImage, ImageType.getJpeg());
outputImage.close();
} catch (java.io.IOException e) {
resultMessage.setText(e.getMessage());
return;
}
resultMessage.
}