Aspose.PDF for Python 的关键特性

通用特性

  • 支持大多数已建立的 PDF 标准和 PDF 规范。
  • 能够读取和导出 PDF 为多种图像格式,包括 BMP、GIF、JPEG 和 PNG。
  • 设置 PDF 文档的基本信息(例如作者、创建者)。
  • 配置 PDF 页面属性(例如宽度、高度、裁剪框、出血框等)。
  • 设置页码、书签层级、页面尺寸等。
  • 能够处理文本、段落、标题、超链接、图形、附件等。

支持的 PDF 标准

  • ISO 32000-1(PDF 1.2,PDF 1.3,PDF 1.4,PDF 1.5,PDF 1.6,PDF 1.7)。
  • ISO 32000-2(PDF 2.0)。
  • ISO 19005(PDF/A)、ISO 15930(PDF/X)、ISO 24517(PDF/E)、ISO 14289(PDF/UA)。

转换功能

Aspose.PDF for Python via .NET 库可帮助您成功、快速、轻松地将 PDF 文档转换为最流行的格式,亦可实现相反的转换。

  • 将 PDF 转换为 Word、Excel 和 PowerPoint。
  • 将 PDF 转换为图像格式。
  • 将 PDF 文件转换为 HTML 格式,反之亦然。
  • 将 PDF 转换为 EPUB、文本、XPS 等。
  • 将 EPUB、Markdown、文本、XPS、PostScript、XML、LaTex 转换为 PDF。

支持的 PDF 版本

Aspose.PDF for Python 支持 PDF 版本 1.2、1.3、1.4、1.5、1.6、1.7 和 2.0。

文本

  • 从页面提取文本。
  • 在页面中搜索文本。
  • 替换文本。
  • 在 PDF 文件中添加文本。

字体

  • 14 种核心字体。
  • Type 1 字体。
  • TrueType 字体。
  • Type 3 字体。
  • CJK 字体。
  • Unicode 支持。

图像

  • 在 PDF 文件中添加图像。
  • 删除图像。
  • 替换图像。
  • 提取图像。
  • PDF 转换为图像格式。

附件

  • 添加附件。
  • 删除附件。

页面

  • 插入 PDF 页面。
  • 删除 PDF 页面。
  • 将 PDF 拆分为单独页面。
  • 将一批页面从一个 PDF 文档移动到另一个 PDF 文档
  • 在当前 PDF 文档中将页面移动到新位置
  • 更改 PDF 页面尺寸
  • 更改页面方向
  • 获取页面属性
  • 获取页面数量
  • 获取页面计数
  • 获取特定页面

文档

  • 创建 PDF 文件
  • 从流打开现有 PDF 文档
  • 打开现有 PDF 文档
  • 设置打印对话框预设属性
  • 向现有 PDF 添加 TOC
  • 向现有 PDF 添加 TOC
  • 在添加目录时自定义页码
  • 设置 PDF 到期日期
  • 扁平化可填写的 PDF
  • 为网络优化 PDF 文档
  • 压缩 PDF 大小
  • 缩小或压缩所有图像
  • 删除未使用的对象
  • 链接重复的流
  • 删除未使用的流
  • 取消嵌入字体
  • 获取文档查看器属性。
  • 设置文档查看器属性。
  • 验证 (PDF/A-1a, PDF/A-1b)。
  • 删除表单字段
  • 确定并设置文档的元数据

书签

  • 添加书签。
  • 添加子书签。
  • 删除书签。
  • 获取书签。
  • 获取子书签。
  • 修改书签。
  • 在查看文档时展开书签。

注释

  • 添加批注。
  • 获取批注。
  • 删除批注。

表单

  • 添加字段。
  • 删除字段。
  • 修改字段。
  • 填写字段。
  • 获取字段值。
  • 支持 XFA(基于 XML 的表单)和 AcroForms(标准表单)。

印章和水印

  • 添加文字印章。
  • 添加图像印章。
  • 添加 PDF 页面印章。

打开加密的 PDF 文档

  • 加密 PDF。
  • 解密 PDF。
  • 修改密码。