Создание помеченного PDF с использованием C#

Создание помеченного PDF означает добавление (или создание) определенных элементов в документ, которые позволят документу быть проверенным в соответствии с требованиями PDF/UA. Эти элементы часто называются элементами структуры.

Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.

Создание помеченного PDF (Простой сценарий)

Для создания элементов структуры в помеченном PDF документе Aspose.PDF предлагает методы для создания элементов структуры с использованием интерфейса ITaggedContent. Следующий фрагмент кода показывает, как создать помеченный PDF, который содержит 2 элемента: заголовок и абзац.

Мы получим следующий документ после создания:

Помеченный PDF документ с 2 элементами - Заголовок и Абзац

Создание помеченного PDF с вложенными элементами (Создание дерева элементов структуры)

В некоторых случаях нам нужно создать более сложную структуру, например, разместить цитаты в абзаце. Для создания дерева элементов структуры мы должны использовать метод AppendChild. Следующий фрагмент кода показывает, как создать дерево элементов структуры помеченного PDF документа:

Мы получим следующий документ после создания: Помеченный PDF документ с вложенными элементами - span и цитаты

Стилизация структуры текста

Для стилизации структуры текста в помеченном PDF документе Aspose.PDF предлагает свойства Font, FontSize, FontStyle и ForegroundColor класса StructureTextState. Следующий фрагмент кода показывает, как стилизовать структуру текста в помеченном PDF документе:

Иллюстрация элементов структуры

Для иллюстрации элементов структуры в помеченном PDF документе Aspose.PDF предлагает класс IllustrationElement. Следующий фрагмент кода показывает, как иллюстрировать элементы структуры в помеченном PDF документе:

Проверка помеченного PDF

Aspose.PDF for .NET предоставляет возможность проверять документ PDF/UA помеченного PDF. Валидация стандарта PDF/UA поддерживает:

  • Проверки на XObjects.
  • Проверки на действия.
  • Проверки на необязательный контент.
  • Проверки на встроенные файлы.
  • Проверки на поля Acroform (Проверка естественного языка и альтернативного имени и цифровых подписей).
  • Проверки на поля формы XFA.
  • Проверки на настройки безопасности.
  • Проверки на навигацию.
  • Проверки на аннотации.

Ниже приведен фрагмент кода, который показывает, как проверить помеченный PDF документ. Соответствующие проблемы будут отображены в XML отчете.

Настройка позиции структуры текста

Следующий фрагмент кода показывает, как настроить позицию структуры текста в помеченном PDF документе:

Автоматическое создание помеченного PDF с конвертацией в PDF/UA-1

Aspose.PDF позволяет автоматически генерировать базовую разметку логической структуры при конвертации документа в PDF/UA-1. Пользователи могут затем вручную улучшить эту базовую логическую структуру, предоставляя дополнительные сведения о содержимом документа.

Чтобы сгенерировать логическую структуру документа, создайте экземпляр класса Aspose.Pdf.AutoTaggingSettings, установите его свойство AutoTaggingSettings.EnableAutoTagging в true и присвойте его свойству PdfFormatConversionOptions.AutoTaggingSettings.

Создание помеченного PDF с полями формы

Вы можете пометить интерактивные поля формы в PDF документе, чтобы гарантировать, что они включены в дерево логической структуры для доступности (PDF/UA). Приведенный ниже фрагмент демонстрирует, как создать поле формы, зарегистрировать его в AcroForm и связать его с элементом структуры /Form в дереве структуры.

Создание помеченного PDF с страницей оглавления (TOC)

Сгенерируйте помеченный PDF документ с доступной страницей оглавления (TOC).

Сгенерируйте помеченный PDF, который включает доступную страницу оглавления, содержащую заголовок страницы и вложенный подсписок.