从 PDF 文件中提取图像使用 Python
Contents
[
Hide
]
你是否需要从PDF文件中分离图像?为了简化管理、存档、分析或分享文档中的图像,可以使用Aspose.PDF for Python从PDF文件中提取图像。
图像保存在每个页面的资源集合的XImage集合中。要提取特定页面的图像,可以使用图像的特定索引从Images集合中获取图像。
图像的索引返回一个XImage对象。该对象提供一个save()方法,可以用来保存提取的图像。以下代码片段展示了如何从PDF文件中提取图像。
import aspose.pdf as ap
# 打开文档
document = ap.Document(input_file)
# 提取特定图像
xImage = document.pages[2].resources.images[1]
outputImage = io.FileIO(output_image, "w")
# 保存输出图像
xImage.save(outputImage)
outputImage.close()