从 PDF 文件中删除图像使用 Python
Contents
[
Hide
]
有很多理由需要从 PDF 中删除所有或特定的图像。
有时,PDF 文件可能包含需要删除的重要图像,以保护隐私或防止未经授权访问某些信息。
删除不需要或冗余的图像可以帮助减少文件大小,从而更容易共享或存储 PDF。
如有必要,您可以通过删除文档中的所有图像来减少页数。此外,从文档中删除图像将有助于为 PDF 的压缩或提取文本信息做准备。
Aspose.PDF for Python via .NET 将帮助您完成此任务。
从 PDF 文件中删除图像
要从 PDF 文件中删除图像:
- 打开现有的 PDF 文档。
- 删除特定的图像。
- 保存更新后的 PDF 文件。
以下代码片段展示了如何从 PDF 文件中删除图像。
import aspose.pdf as ap
# 打开文档
document = ap.Document(input_file)
# 删除特定图像
document.pages[2].resources.images.delete(1)
# 保存更新后的 PDF 文件
document.save(output_pdf)
从输入 PDF 中删除所有图像
import aspose.pdf as ap
# 打开文档
document = ap.Document(input_file)
# 删除所有页面上的所有图像
for i in range(len(document.pages)):
while len(document.pages[i + 1].resources.images) != 0:
document.pages[i + 1].resources.images.delete(1)
# 保存更新后的 PDF 文件
document.save(output_file)