Convertir PDF a otros formatos de documentos

Aspose.Words puede cargar incluso un formato tan complejo como PDF. Esto abre nuevas oportunidades: es posible convertir PDF a Word u otros formatos que llevan a los usuarios muy por delante en la resolución de muchos problemas aplicados.

Convertir PDF a otros formatos

La conversión más popular de PDF es la conversión a formatos Microsoft Word como DOCX, DOC, así como formatos de imagen como JPG o PNG. Dicho esto, la conversión de un documento de un formato a otro se realiza de forma familiar.

El siguiente ejemplo de código muestra cómo convertir un documento de PDF a DOCX:

Especificar opciones de carga al importar PDF

Aspose.Words le proporciona la clase PdfLoadOptions, que permite un control más preciso sobre cómo se cargan los documentos PDF.

La mayoría de las propiedades heredan o sobrecargan propiedades que ya existen en la clase LoadOptions. Además de ellas, se especifican una serie de propiedades para el formato PDF. Por ejemplo, puede utilizar las propiedades page_count y page_index para definir el rango de páginas que se cargarán desde un documento PDF y las propiedades skip_pdf_images para controlar si las imágenes deben omitirse al cargar un PDF. Otro parámetro admitido es el password, que debe proporcionarse para documentos protegidos con contraseña.

Contenido PDF compatible

El complemento PDF2Word actualmente admite los siguientes tipos de datos:

  • Párrafos de texto
  • Imágenes
  • Mesas
  • Listas
  • Encabezados y pies de pagina
  • Notas a pie de página
  • Número de páginas
  • Texto de derecha a izquierda (con algunas limitaciones)
  • Archivos PDF con capacidad de búsqueda (las imágenes frontales se eliminarán en favor del texto de fondo)

Funciones planificadas

Algunas características aún se encuentran en desarrollo inicial o están incluidas en la hoja de ruta de desarrollo:

  • Tabla de contenido
  • OCR para archivos PDF con y sin búsqueda
  • Informe de progreso
  • Texto de varias columnas
  • Fórmulas matemáticas
  • Más campos automáticos (además de PAGE y NUMPAGES)

Excepciones de carga de PDF

Durante la conversión de un documento PDF, puede ocurrir una de las siguientes excepciones:

Excepción Descripción
FileLoadException Un archivo PDF no se puede procesar por algún motivo.
.
DrmProtectedFileException Un archivo PDF está protegido por Adobe DRM y no puede ser decodificado por Pdf2Word.
PasswordProtectedFileException Se debe proporcionar la contraseña correcta para un PDF protegido con contraseña.