解析 PDF 文档
Contents
[
Hide
]
Parse PDF 文档是指从 PDF 文件中提取各种信息的相关术语。本节涵盖如何:
- 从 PDF 中提取文本. 文本解析或提取是最常见的操作,适用于已有的 PDF。您将学习如何从整个文档、特定页面或页面中的特定区域进行文本解析。
- 从 PDF 中提取图像. Image Extraction 对图像执行的操作与上述对文本的操作相同。
- 提取 PDF 中的字体. Font Extraction 是在 PDF 中对字体的特定操作。
- 从表单提取数据. 如果您拥有一堆包含表单的 PDF 文档,可能需要从这些表单中获取数据。本文将帮助您了解如何使用 Aspose.PDF for Python via .NET 提取 AcroForms 数据。
- 从表格提取数据. 从 PDF 文档中的表格获取数据。
- 从 PDF 提取矢量数据. 您可以获取向量数据(路径、多边形、折线),例如位置、颜色、线宽等。