从 PDF 中提取图像

PDF 文档中的每一页包含资源（图像、表单和字体）。我们可以通过调用 getResources 方法访问这些资源。Resources 类包含 XImageCollection，我们可以通过调用 getImages 方法获取图像列表。

因此，要从页面中提取图像，我们需要获取对页面的引用，然后是页面资源，最后是图像集合。

我们可以通过索引提取特定图像。

图像的索引返回一个 XImage 对象。这个对象提供一个 Save 方法，可以用来保存提取的图像。以下代码片段展示了如何从 PDF 文件中提取图像。

public void extractImage () {
    // 打开文档
    try {
        document=new Document(inputStream);
    } catch (Exception e) {
        resultMessage.setText(e.getMessage());
        return;
    }

    com.aspose.pdf.Page page=document.getPages().get_Item(1);
    com.aspose.pdf.XImageCollection xImageCollection=page.getResources().getImages();
    // 提取特定图像
    com.aspose.pdf.XImage xImage=xImageCollection.get_Item(1);
    File file=new File(fileStorage, "extracted-image.jpeg");
    try {
        java.io.FileOutputStream outputImage=new java.io.FileOutputStream(file.toString());
        // 保存输出图像
        xImage.save(outputImage, ImageType.getJpeg());
        outputImage.close();
    } catch (java.io.IOException e) {
        resultMessage.setText(e.getMessage());
        return;
    }
    resultMessage.
}

从PDF中提取文本从PDF中提取表格数据