从PDF中提取标记内容
在本文中,您将学习如何使用C#提取标记内容的PDF文档。
以下代码片段也适用于Aspose.PDF.Drawing库。
获取标记PDF内容
为了获取带有标记文本的PDF文档内容,Aspose.PDF提供了Document类的TaggedContent属性。
以下代码片段演示了如何获取带有标记文本的PDF文档内容:
获取根结构
为了获取标记PDF文档的根结构,Aspose.PDF提供了ITaggedContent接口的StructTreeRootElement属性和StructureElement。以下代码片段演示了如何获取标记PDF文档的根结构:
访问子元素
为了访问标记PDF文档的子元素,Aspose.PDF提供了ElementList类。以下代码片段演示了如何访问标记PDF文档的子元素:
在现有PDF中标记图像
为了在现有PDF文档中标记图像,Aspose.PDF提供了StructureElement类的FindElements方法。您可以使用FigureElement类的AlternativeText属性为图形添加替代文本。
以下代码片段演示了如何在现有PDF文档中标记图像: