从 PDF 文件中删除图像使用 Python

有很多理由需要从 PDF 中删除所有或特定的图像。

有时,PDF 文件可能包含需要删除的重要图像,以保护隐私或防止未经授权访问某些信息。

删除不需要或冗余的图像可以帮助减少文件大小,从而更容易共享或存储 PDF。

如有必要,您可以通过删除文档中的所有图像来减少页数。此外,从文档中删除图像将有助于为 PDF 的压缩或提取文本信息做准备。

Aspose.PDF for Python via .NET 将帮助您完成此任务。

从 PDF 文件中删除图像

要从 PDF 文件中删除图像:

  1. 打开现有的 PDF 文档。
  2. 删除特定的图像。
  3. 保存更新后的 PDF 文件。

以下代码片段展示了如何从 PDF 文件中删除图像。


    import aspose.pdf as ap

    # 打开文档
    document = ap.Document(input_file)

    # 删除特定图像
    document.pages[2].resources.images.delete(1)

    # 保存更新后的 PDF 文件
    document.save(output_pdf)

从输入 PDF 中删除所有图像


    import aspose.pdf as ap

    # 打开文档
    document = ap.Document(input_file)

    # 删除所有页面上的所有图像
    for i in range(len(document.pages)):
        while len(document.pages[i + 1].resources.images) != 0:
            document.pages[i + 1].resources.images.delete(1)

    # 保存更新后的 PDF 文件
    document.save(output_file)