从PDF文件中提取图像

Contents
[ ]

每个页面都有一个资源集合,而该集合中包含了图像集合,其中保存了页面中的所有图像。 XImage对象可以获取图像集合中的指定图像。

要从页面中提取图像:

从图像集合中使用图像索引获取图像。 使用XImage对象的save(..)方法保存提取的图像。

以下代码片段向您展示如何从PDF文件中提取图像。

package com.aspose.pdf.examples;

import java.io.FileOutputStream;
import java.io.IOException;

import com.aspose.pdf.*;
import com.aspose.pdf.internal.html.rendering.image.ImageFormat;

public class ExampleExtractImages {

    private static String _dataDir = "/home/admin1/pdf-examples/Samples/";

    public static void ExtractImages() throws IOException {

        // 打开文档
        Document pdfDocument = new Document(_dataDir + "ExtractImages.pdf");

        // 提取特定图像
        XImage xImage = pdfDocument.getPages().get_Item(1).getResources().getImages().get_Item(1);

        FileOutputStream outputImage = new FileOutputStream(_dataDir + "output.jpg");

        // 保存输出图像
        xImage.save(outputImage, ImageFormat.Jpeg);
        outputImage.close();

        // 保存更新的PDF文件
        pdfDocument.save(_dataDir + "ExtractImages_out.pdf");
    }
}