使用 C# 创建标记 PDF

创建标记 PDF 意味着向文档添加(或创建)某些元素,以使文档能够根据 PDF/UA 要求进行验证。这些元素通常称为结构元素。

以下代码片段也适用于 Aspose.PDF.Drawing 库。

创建标记 PDF(简单场景)

为了在标记 PDF 文档中创建结构元素,Aspose.PDF 提供了使用 ITaggedContent 接口创建结构元素的方法。以下代码片段显示了如何创建包含 2 个元素的标记 PDF:标题和段落。

创建后,我们将获得以下文档:

包含 2 个元素 - 标题和段落的标记 PDF 文档

创建带有嵌套元素的标记 PDF(创建结构元素树)

在某些情况下,我们需要创建更复杂的结构,例如在段落中放置引号。 为了创建结构元素树,我们应该使用 AppendChild 方法。 以下代码片段显示了如何创建标记 PDF 文档的结构元素树:

创建后,我们将获得以下文档: 带有嵌套元素 - span 和引号的标记 PDF 文档

样式文本结构

为了在标记 PDF 文档中样式文本结构,Aspose.PDF 提供了 FontFontSizeFontStyleForegroundColor 属性的 StructureTextState 类。以下代码片段显示了如何在标记 PDF 文档中样式文本结构:

说明结构元素

为了在标记 PDF 文档中说明结构元素,Aspose.PDF 提供了 IllustrationElement 类。以下代码片段显示了如何在标记 PDF 文档中说明结构元素:

验证标记 PDF

Aspose.PDF for .NET 提供了验证 PDF/UA 标记 PDF 文档的能力。PDF/UA 标准的验证支持:

  • 检查 XObjects。
  • 检查操作。
  • 检查可选内容。
  • 检查嵌入文件。
  • 检查 Acroform 字段(验证自然语言和替代名称及数字签名)。
  • 检查 XFA 表单字段。
  • 检查安全设置。
  • 检查导航。
  • 检查注释。

以下代码片段显示了如何验证标记 PDF 文档。相应的问题将显示在 XML 日志报告中。

调整文本结构的位置

以下代码片段显示了如何调整标记 PDF 文档中文本结构的位置:

使用 PDF/UA-1 转换自动创建标记 PDF

Aspose.PDF 在将文档转换为 PDF/UA-1 时启用基本逻辑结构标记的自动生成。用户可以手动改进此基本逻辑结构,提供有关文档内容的更多见解。

要生成逻辑文档结构,请创建 Aspose.Pdf.AutoTaggingSettings 类的实例,将其 AutoTaggingSettings.EnableAutoTagging 设置为 true,并将其分配给 PdfFormatConversionOptions.AutoTaggingSettings 属性。