Fundamentos de la API DOM de Aspose.PDF

Introducción a la API DOM

El Modelo de Objetos del Documento (DOM) es una forma de representación de documentos estructurados como un modelo orientado a objetos. DOM es el estándar oficial del Consorcio World Wide Web (W3C) para representar documentos estructurados de manera neutral en cuanto a plataforma y lenguaje.

En palabras simples, el DOM es un árbol de objetos que representan la estructura de algún documento. Aspose.PDF for .NET también utiliza la idea de DOM para representar la estructura de un documento PDF en términos de objetos. Sin embargo, los aspectos del DOM (como sus Elementos) se manipulan dentro de la sintaxis del lenguaje de programación en uso. La interfaz pública de un DOM se especifica en su interfaz de programación de aplicaciones (API).

Introducción al Documento PDF

El Formato de Documento Portátil (PDF) es un estándar abierto para el intercambio de documentos. Un documento PDF es una combinación de texto y datos binarios. Si lo abres en un editor de texto, verás los objetos en bruto que definen la estructura y el contenido del documento.

La estructura lógica de un archivo PDF es jerárquica y determina la secuencia por la cual una aplicación de visualización dibuja las páginas del documento y su contenido. Un PDF se compone de cuatro componentes: objetos, estructura de archivo, estructura de documento y flujos de contenido.

Estructura del Documento PDF

Dado que la estructura de un archivo PDF es jerárquica, Aspose.PDF for .NET también accede a los elementos de la misma manera. La siguiente jerarquía te muestra cómo está estructurado lógicamente el documento PDF y cómo lo construye la API DOM de Aspose.PDF for .NET.

Estructura del Documento PDF

Accediendo a los Elementos del Documento PDF

El objeto Document está en el nivel raíz del modelo de objetos. La API DOM de Aspose.PDF for .NET te permite crear un objeto Document y luego acceder a todos los demás objetos en la jerarquía. Puedes acceder a cualquiera de las colecciones como Pages o a elementos individuales como Page, etc. La API DOM proporciona puntos de entrada y salida únicos para manipular el documento PDF como se muestra a continuación:

  • Abrir documento PDF.
  • Acceder a la estructura del documento PDF en estilo DOM.
  • Actualizar datos en el documento PDF.
  • Validar documento PDF.
  • Exportar documento PDF a diferentes formatos.
  • Finalmente, guardar el documento PDF actualizado.

Cómo Usar la Nueva API Aspose.PDF for .NET

Este tema explicará la nueva API Aspose.PDF for .NET y te guiará para comenzar de manera rápida y sencilla. Ten en cuenta que los detalles sobre el uso de características particulares no son parte de este artículo.

La Aspose.PDF for .NET se compone de dos partes:

  • API DOM de Aspose.PDF for .NET.
  • Aspose.Pdf.Facades (antiguo Aspose.PDF.Kit para .NET).

Encontrarás los detalles de cada una de estas áreas a continuación.

API DOM de Aspose.PDF for .NET

La API DOM de Aspose.PDF for .NET corresponde a la estructura del documento PDF, que te ayuda a trabajar con los documentos PDF no solo a nivel de archivo y documento, sino también a nivel de objeto. Hemos proporcionado más flexibilidad a los desarrolladores para acceder a todos los elementos y objetos del documento PDF. Usando las clases de la API DOM de Aspose.PDF, puedes obtener acceso programático a los elementos y formato del documento. Esta nueva API DOM está compuesta por varios espacios de nombres como se indica a continuación:

Aspose.PDF

Este espacio de nombres proporciona la clase Document que te permite abrir y guardar un documento PDF. La clase License también es parte de este espacio de nombres. También proporciona clases relacionadas con páginas PDF, adjuntos y marcadores como Page, PageCollection, FileSpecification, EmbeddedFileCollection, OutlineItemCollection y OutlineCollection, etc.

Aspose.Text

Este espacio de nombres proporciona clases que te ayudan a trabajar con el texto y sus varios aspectos, por ejemplo Font, FontCollection, FontRepository, FontStyles, TextAbsorber, TextFragment, TextFragmentAbsorber, TextFragmentCollection, TextFragmentState, TextSegment y TextSegmentCollection, etc.

Aspose.Text.TextOptions

Este espacio de nombres proporciona clases que te permiten establecer diferentes opciones para buscar, editar o reemplazar texto, por ejemplo TextEditOptions, TextReplaceOptions y TextSearchOptions.

Aspose.InteractiveFeatures

Este espacio de nombres contiene clases que te ayudan a trabajar con las características interactivas del documento PDF, por ejemplo, trabajar con el documento y otras acciones. Este espacio de nombres contiene clases como GoToAction, GoToRemoteAction y GoToURIAction, etc.

Aspose.InteractiveFeatures.Annotations

Las anotaciones son parte de las características interactivas de un documento PDF. Hemos dedicado un espacio de nombres para anotaciones. Este espacio de nombres contiene clases que te ayudan a trabajar con las anotaciones, por ejemplo, Annotation, AnnotationCollection, CircleAnnotation y LinkAnnotation, etc.

Aspose.InteractiveFeatures.Forms

Este espacio de nombres contiene clases que te ayudan a trabajar con formularios PDF y campos de formulario, por ejemplo Form, Field, TextBoxField y OptionCollection, etc.

Aspose.Pdf.Devices

Podemos realizar varias operaciones en los documentos PDF, como convertir un documento PDF a varios formatos de imagen. Sin embargo, tales operaciones no pertenecen al objeto Document y no podemos extender la clase Document para tales operaciones. Por eso hemos introducido el concepto de Device en la nueva API DOM.

Aspose.Pdf.Facades

Antes de Aspose.PDF for .NET, necesitabas Aspose.PDF.Kit para .NET para manipular archivos PDF existentes. Para ejecutar el código antiguo de Aspose.PDF.Kit, puedes usar el espacio de nombres Aspose.PDF.Facades.