Основы Aspose.PDF DOM API

Введение в DOM API

Модель Объектного Документа (DOM) - это форма представления структурированных документов как объектно-ориентированной модели. DOM является официальным стандартом Консорциума Всемирной паутины (W3C) для представления структурированных документов в платформо- и языко-независимой форме.

Проще говоря, DOM - это дерево объектов, представляющих структуру какого-либо документа. Aspose.PDF for Java также использует идею DOM для представления структуры PDF-документа в терминах объектов. Однако аспекты DOM (такие как его элементы) манипулируются в синтаксисе используемого языка программирования. Публичный интерфейс DOM указан в его интерфейсе прикладного программирования (API).

Введение в документ PDF

Portable Document Format (PDF) — это открытый стандарт для обмена документами. PDF-документ представляет собой комбинацию текста и двоичных данных. Если вы откроете его в текстовом редакторе, вы увидите необработанные объекты, определяющие структуру и содержимое документа.

Логическая структура PDF-файла является иерархической и определяет последовательность, в которой приложение для просмотра отображает страницы документа и их содержимое. PDF состоит из четырех компонентов: объектов, структуры файла, структуры документа и потоков содержимого.

Структура документа PDF

Поскольку структура PDF-файла является иерархической, Aspose.PDF for Java также получает доступ к элементам таким же образом. Следующая иерархия показывает, как PDF-документ логически структурирован и как Aspose.PDF для Java DOM API его строит.

Структура PDF документа

Доступ к элементам PDF документа

Объект Document находится на корневом уровне объектной модели. Aspose.PDF для Java DOM API позволяет создать объект Document, а затем получить доступ ко всем другим объектам в иерархии. Вы можете получить доступ либо к любым коллекциям, например, Pages, либо к отдельным элементам, таким как Page и т.д. DOM API предоставляет единые входные и выходные точки для управления PDF-документом, как показано ниже:

  • Открытие PDF документа
  • Доступ к структуре PDF документа в стиле DOM
  • Обновление данных в PDF документе
  • Валидация PDF документа
  • Экспорт PDF документа в разные форматы
  • Наконец, сохранение обновленного PDF документа

Как использовать новый Aspose.PDF для Java API

Эта тема объяснит новый Aspose.PDF для Java API и поможет вам быстро и легко начать работу. Обратите внимание, что подробности использования определенных функций не являются частью этой статьи.

Aspose.PDF для Java состоит из двух частей:

  • Aspose.PDF для Java DOM API
  • Aspose.PDF.Facades

Вы найдете подробности каждой из этих областей ниже.

Aspose.PDF для Java DOM API

Новый Aspose.PDF для Java DOM API соответствует структуре PDF-документа, что помогает вам работать с PDF-документами не только на уровне файлов и документов, но и на уровне объектов. Мы предоставили разработчикам больше гибкости в доступе ко всем элементам и объектам PDF-документа. Используя классы Aspose.PDF DOM API, вы можете получить программный доступ к элементам документа и форматированию. Этот новый DOM API состоит из различных пространств имен, как указано ниже:

com.aspose.pdf

Это пространство имен предоставляет класс Document, который позволяет открывать и сохранять PDF-документ. The License класс также является частью этого пространства имен. Оно также предоставляет классы, связанные с PDF страницами, вложениями и закладками, такие как com.aspose.pdf.Page, com.aspose.pdf.PageCollection, com.aspose.pdf.FileSpecification, com.aspose.pdf.EmbeddedFileCollection, com.aspose.pdf.OutlineItemCollection и com.aspose.pdf.OutlineCollection и т.д.

com.aspose.pdf.text

Это пространство имен предоставляет классы, которые помогают работать с текстом и его различными аспектами, например, com.aspose.pdf.Font, com.aspose.pdf.FontCollection, com.aspose.pdf.FontRepository, com.aspose.pdf.FontStyles, com.aspose.pdf.TextAbsorber, com.aspose.pdf.TextFragment, com.aspose.pdf.TextFragmentAbsorber, com.aspose.pdf.TextFragmentCollection, com.aspose.pdf.TextFragmentState, com.aspose.pdf.TextSegment и com.aspose.pdf.TextSegmentCollection и т.д.

com.aspose.pdf.TextOptions

Это пространство имен предоставляет классы, которые позволяют устанавливать различные параметры для поиска, редактирования или замены текста, например, com.aspose.pdf.TextEditOptions, com.aspose.pdf.TextReplaceOptions и com.aspose.pdf.TextSearchOptions.

com.aspose.pdf.PdfAction

Этот пространство имен содержит классы, которые помогают работать с интерактивными функциями PDF-документа, например, работать с документом и другими действиями. Это пространство имен содержит такие классы, как com.aspose.pdf.GoToAction, com.aspose.pdf.GoToRemoteAction и com.aspose.pdf.GoToURIAction и т.д.

com.aspose.pdf.Annotation

Аннотации являются частью интерактивных функций PDF-документа. Мы выделили пространство имен для аннотаций. Это пространство имен содержит классы, которые помогают работать с аннотациями, например, com.aspose.pdf.Annotation, com.aspose.pdf.AnnotationCollection, com.aspose.pdf.CircleAnnotation и com.aspose.pdf.LinkAnnotation и т.д.

com.aspose.pdf.Form

Это пространство имен содержит классы, которые помогают работать с PDF-формами и полями форм, например, com.aspose.pdf.Form, com.aspose.pdf.Field, com.aspose.pdf.TextBoxField и com.aspose.pdf.OptionCollection и т.д.

com.aspose.pdf.devices

Мы можем выполнять различные операции с PDF-документами, такие как преобразование PDF-документов в различные форматы изображений. Однако такие операции не относятся к объекту Document, и мы не можем расширять класс Document для таких операций. Именно поэтому в новом API DOM был введен концепт Устройства.

com.aspose.pdf.facades

Ранее для Aspose.PDF for Java требовался Aspose.PDF.Kit for Java для обработки существующих PDF файлов. Чтобы выполнить старый код Aspose.PDF.Kit, можно использовать пространство имен com.aspose.pdf.facades.