Noções Básicas da API DOM do Aspose.PDF

Introdução à API DOM

Document Object Model (DOM) é uma forma de representação de documentos estruturados como um modelo orientado a objetos. DOM é o padrão oficial do World Wide Web Consortium (W3C) para representar documentos estruturados de maneira neutra em termos de plataforma e linguagem.

Em palavras simples, DOM é uma árvore de objetos que representam a estrutura de algum documento. Aspose.PDF para Java também usa a ideia de DOM para representar a estrutura de um documento PDF em termos de objetos. No entanto, os aspectos do DOM (como seus Elementos) são manipulados dentro da sintaxe da linguagem de programação em uso. A interface pública de um DOM é especificada em sua interface de programação de aplicativos (API).

Introdução ao Documento PDF

O Portable Document Format (PDF) é um padrão aberto para troca de documentos. Um documento PDF é uma combinação de dados de texto e binários. Se você abri-lo em um editor de texto, verá os objetos brutos que definem a estrutura e o conteúdo do documento.

A estrutura lógica de um arquivo PDF é hierárquica e determina a sequência pela qual um aplicativo de visualização desenha as páginas do documento e seus conteúdos. Um PDF é composto por quatro componentes: objetos, estrutura de arquivo, estrutura do documento e fluxos de conteúdo.

Estrutura do Documento PDF

Como a estrutura de um arquivo PDF é hierárquica, o Aspose.PDF para Java também acessa os elementos da mesma maneira. A seguinte hierarquia mostra como o documento PDF é estruturado logicamente e como o Aspose.PDF para Java DOM API o constrói.

Estrutura do Documento PDF

Acessando Elementos do Documento PDF

O objeto Document está no nível raiz do modelo de objetos. O Aspose.PDF para Java DOM API permite que você crie um objeto Document e então acesse todos os outros objetos na hierarquia. Você pode acessar qualquer uma das coleções como Pages ou um elemento individual como Page, etc. A API DOM fornece pontos de entrada e saída únicos para manipular o documento PDF conforme mostrado abaixo:

  • Abrir documento PDF
  • Acessar a estrutura do documento PDF no estilo DOM
  • Atualizar dados no documento PDF
  • Validar documento PDF
  • Exportar documento PDF em diferentes formatos
  • Finalmente, salvar o documento PDF atualizado

Como Usar a Nova API Aspose.PDF para Java

Este tópico explicará a nova API Aspose.PDF para Java e guiará você a começar de forma rápida e fácil. Por favor, note que os detalhes sobre o uso das funcionalidades específicas não fazem parte deste artigo.

O Aspose.PDF para Java é composto por duas partes:

  • Aspose.PDF para Java DOM API
  • Aspose.PDF.Facades

Você encontrará os detalhes de cada uma dessas áreas abaixo.

Aspose.PDF para Java DOM API

O novo Aspose.PDF para Java DOM API corresponde à estrutura do documento PDF, o que ajuda a trabalhar com documentos PDF não apenas no nível de arquivo e documento, mas também no nível de objeto. Nós fornecemos mais flexibilidade aos desenvolvedores para acessar todos os elementos e objetos do documento PDF. Usando as classes do Aspose.PDF DOM API, você pode obter acesso programático aos elementos e formatação do documento. Esta nova API DOM é composta por vários namespaces conforme dado abaixo:

com.aspose.pdf

Este namespace fornece a classe Document que permite abrir e salvar um documento PDF. A classe License também faz parte deste namespace. Ela também fornece classes relacionadas a páginas de PDF, anexos e marcadores como com.aspose.pdf.Page, com.aspose.pdf.PageCollection, com.aspose.pdf.FileSpecification, com.aspose.pdf.EmbeddedFileCollection, com.aspose.pdf.OutlineItemCollection e com.aspose.pdf.OutlineCollection etc.

com.aspose.pdf.text

Este namespace fornece classes que ajudam você a trabalhar com o texto e seus vários aspectos, por exemplo, com.aspose.pdf.Font, com.aspose.pdf.FontCollection, com.aspose.pdf.FontRepository, com.aspose.pdf.FontStyles, com.aspose.pdf.TextAbsorber, com.aspose.pdf.TextFragment, com.aspose.pdf.TextFragmentAbsorber, com.aspose.pdf.TextFragmentCollection, com.aspose.pdf.TextFragmentState, com.aspose.pdf.TextSegment e com.aspose.pdf.TextSegmentCollection etc.

com.aspose.pdf.TextOptions

Este namespace fornece classes que permitem definir diferentes opções para pesquisar, editar ou substituir texto, por exemplo, com.aspose.pdf.TextEditOptions, com.aspose.pdf.TextReplaceOptions e com.aspose.pdf.TextSearchOptions.

com.aspose.pdf.PdfAction

Este namespace contém classes que ajudam você a trabalhar com os recursos interativos do documento PDF, por exemplo, trabalhar com o documento e outras ações. Este namespace contém classes como com.aspose.pdf.GoToAction, com.aspose.pdf.GoToRemoteAction e com.aspose.pdf.GoToURIAction etc.

com.aspose.pdf.Annotation

As anotações são parte dos recursos interativos de um documento PDF. Dedicamos um namespace para anotações. Este namespace contém classes que ajudam você a trabalhar com as anotações, por exemplo, com.aspose.pdf.Annotation, com.aspose.pdf.AnnotationCollection, com.aspose.pdf.CircleAnnotation e com.aspose.pdf.LinkAnnotation etc.

com.aspose.pdf.Form

Este namespace contém classes que ajudam você a trabalhar com formulários PDF e campos de formulário, por exemplo, com.aspose.pdf.Form, com.aspose.pdf.Field, com.aspose.pdf.TextBoxField e com.aspose.pdf.OptionCollection etc.

com.aspose.pdf.devices

Podemos realizar várias operações nos documentos PDF, como converter o documento PDF para vários formatos de imagem. However, such operations do not belong to the Document object and we cannot extend the Document class for such operations. That’s why we have introduced the concept of the Device in the new DOM API.

com.aspose.pdf.facades

Anteriormente ao Aspose.PDF para Java, você precisava do Aspose.PDF.Kit para Java para manipular arquivos PDF existentes. Para executar o código antigo do Aspose.PDF.Kit, pode-se usar o namespace com.aspose.pdf.facades.