Основы Aspose.PDF DOM API
Введение в DOM API
Модель Объектного Документа (DOM) - это форма представления структурированных документов как объектно-ориентированной модели. DOM является официальным стандартом Консорциума Всемирной паутины (W3C) для представления структурированных документов в платформо- и языко-независимой форме.
Проще говоря, DOM - это дерево объектов, представляющих структуру какого-либо документа. Aspose.PDF for Java также использует идею DOM для представления структуры PDF-документа в терминах объектов. Однако аспекты DOM (такие как его элементы) манипулируются в синтаксисе используемого языка программирования. Публичный интерфейс DOM указан в его интерфейсе прикладного программирования (API).
Введение в документ PDF
Portable Document Format (PDF) — это открытый стандарт для обмена документами. PDF-документ представляет собой комбинацию текста и двоичных данных. Если вы откроете его в текстовом редакторе, вы увидите необработанные объекты, определяющие структуру и содержимое документа.
Логическая структура PDF-файла является иерархической и определяет последовательность, в которой приложение для просмотра отображает страницы документа и их содержимое. PDF состоит из четырех компонентов: объектов, структуры файла, структуры документа и потоков содержимого.
Структура документа PDF
Поскольку структура PDF-файла является иерархической, Aspose.PDF for Java также получает доступ к элементам таким же образом. Следующая иерархия показывает, как PDF-документ логически структурирован и как Aspose.PDF для Java DOM API его строит.
Доступ к элементам PDF документа
Объект Document находится на корневом уровне объектной модели. Aspose.PDF для Java DOM API позволяет создать объект Document, а затем получить доступ ко всем другим объектам в иерархии. Вы можете получить доступ либо к любым коллекциям, например, Pages, либо к отдельным элементам, таким как Page и т.д. DOM API предоставляет единые входные и выходные точки для управления PDF-документом, как показано ниже:
- Открытие PDF документа
- Доступ к структуре PDF документа в стиле DOM
- Обновление данных в PDF документе
- Валидация PDF документа
- Экспорт PDF документа в разные форматы
- Наконец, сохранение обновленного PDF документа
Как использовать новый Aspose.PDF для Java API
Эта тема объяснит новый Aspose.PDF для Java API и поможет вам быстро и легко начать работу. Обратите внимание, что подробности использования определенных функций не являются частью этой статьи.
Aspose.PDF для Java состоит из двух частей:
- Aspose.PDF для Java DOM API
- Aspose.PDF.Facades
Вы найдете подробности каждой из этих областей ниже.
Aspose.PDF для Java DOM API
Новый Aspose.PDF для Java DOM API соответствует структуре PDF-документа, что помогает вам работать с PDF-документами не только на уровне файлов и документов, но и на уровне объектов. Мы предоставили разработчикам больше гибкости в доступе ко всем элементам и объектам PDF-документа. Используя классы Aspose.PDF DOM API, вы можете получить программный доступ к элементам документа и форматированию. Этот новый DOM API состоит из различных пространств имен, как указано ниже:
com.aspose.pdf
Это пространство имен предоставляет класс Document, который позволяет открывать и сохранять PDF-документ. The License класс также является частью этого пространства имен. Оно также предоставляет классы, связанные с PDF страницами, вложениями и закладками, такие как com.aspose.pdf.Page, com.aspose.pdf.PageCollection, com.aspose.pdf.FileSpecification, com.aspose.pdf.EmbeddedFileCollection, com.aspose.pdf.OutlineItemCollection и com.aspose.pdf.OutlineCollection и т.д.
com.aspose.pdf.text
Это пространство имен предоставляет классы, которые помогают работать с текстом и его различными аспектами, например, com.aspose.pdf.Font, com.aspose.pdf.FontCollection, com.aspose.pdf.FontRepository, com.aspose.pdf.FontStyles, com.aspose.pdf.TextAbsorber, com.aspose.pdf.TextFragment, com.aspose.pdf.TextFragmentAbsorber, com.aspose.pdf.TextFragmentCollection, com.aspose.pdf.TextFragmentState, com.aspose.pdf.TextSegment и com.aspose.pdf.TextSegmentCollection и т.д.
com.aspose.pdf.TextOptions
Это пространство имен предоставляет классы, которые позволяют устанавливать различные параметры для поиска, редактирования или замены текста, например, com.aspose.pdf.TextEditOptions, com.aspose.pdf.TextReplaceOptions и com.aspose.pdf.TextSearchOptions.
com.aspose.pdf.PdfAction
Этот пространство имен содержит классы, которые помогают работать с интерактивными функциями PDF-документа, например, работать с документом и другими действиями. Это пространство имен содержит такие классы, как com.aspose.pdf.GoToAction, com.aspose.pdf.GoToRemoteAction и com.aspose.pdf.GoToURIAction и т.д.
com.aspose.pdf.Annotation
Аннотации являются частью интерактивных функций PDF-документа. Мы выделили пространство имен для аннотаций. Это пространство имен содержит классы, которые помогают работать с аннотациями, например, com.aspose.pdf.Annotation, com.aspose.pdf.AnnotationCollection, com.aspose.pdf.CircleAnnotation и com.aspose.pdf.LinkAnnotation и т.д.
com.aspose.pdf.Form
Это пространство имен содержит классы, которые помогают работать с PDF-формами и полями форм, например, com.aspose.pdf.Form, com.aspose.pdf.Field, com.aspose.pdf.TextBoxField и com.aspose.pdf.OptionCollection и т.д.
com.aspose.pdf.devices
Мы можем выполнять различные операции с PDF-документами, такие как преобразование PDF-документов в различные форматы изображений. Однако такие операции не относятся к объекту Document, и мы не можем расширять класс Document для таких операций. Именно поэтому в новом API DOM был введен концепт Устройства.
com.aspose.pdf.facades
Ранее для Aspose.PDF for Java требовался Aspose.PDF.Kit for Java для обработки существующих PDF файлов. Чтобы выполнить старый код Aspose.PDF.Kit, можно использовать пространство имен com.aspose.pdf.facades.