从PDF中提取标记内容

在本文中,您将学习如何使用C#提取标记内容的PDF文档。

以下代码片段也适用于Aspose.PDF.Drawing库。

获取标记PDF内容

为了获取带有标记文本的PDF文档内容,Aspose.PDF提供了Document类的TaggedContent属性。

以下代码片段演示了如何获取带有标记文本的PDF文档内容:

获取根结构

为了获取标记PDF文档的根结构,Aspose.PDF提供了ITaggedContent接口的StructTreeRootElement属性和StructureElement。以下代码片段演示了如何获取标记PDF文档的根结构:

访问子元素

为了访问标记PDF文档的子元素,Aspose.PDF提供了ElementList类。以下代码片段演示了如何访问标记PDF文档的子元素:

在现有PDF中标记图像

为了在现有PDF文档中标记图像,Aspose.PDF提供了StructureElement类的FindElements方法。您可以使用FigureElement类的AlternativeText属性为图形添加替代文本。

以下代码片段演示了如何在现有PDF文档中标记图像: