从 PDF 文件中提取图像使用 Python

Contents
[ ]

你是否需要从PDF文件中分离图像?为了简化管理、存档、分析或分享文档中的图像,可以使用Aspose.PDF for Python从PDF文件中提取图像。

图像保存在每个页面的资源集合的XImage集合中。要提取特定页面的图像,可以使用图像的特定索引从Images集合中获取图像。

图像的索引返回一个XImage对象。该对象提供一个save()方法,可以用来保存提取的图像。以下代码片段展示了如何从PDF文件中提取图像。


    import aspose.pdf as ap

    # 打开文档
    document = ap.Document(input_file)

    # 提取特定图像
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # 保存输出图像
    xImage.save(outputImage)
    outputImage.close()