Analizar documentos PDF

Contents
[ ]

Parse PDF documentos es un término relacionado con la extracción de varios tipos de información de un archivo PDF. Esta sección cubre cómo:

  • Extraer texto de PDF. El análisis o extracción de texto es la operación más popular con PDFs listos. Aprenderás sobre el análisis de texto de un documento completo, una página específica o una región particular en una página.
  • Extraer imágenes de PDF. La extracción de imágenes hace lo mismo para imágenes que la operación anterior para texto.
  • Extraer fuentes de PDF. La extracción de fuentes es una operación específica con fuentes en PDFs.
  • Extraer datos del formulario. Si tienes un montón de documentos PDF con Formularios, probablemente necesites obtener los datos de esos formularios. Este artículo te ayudará a comprender cómo extraer datos de AcroForms con Aspose.PDF for Python via .NET.
  • Extraer datos de una tabla. Obtener datos de la tabla en un documento PDF.
  • Extraer datos vectoriales de PDF. Puedes obtener los datos vectoriales (ruta, polígono, polilínea), como posición, color, ancho de línea, etc.