Analyser des documents PDF

Contents
[ ]

Parse PDF documents est un terme lié à l’extraction de divers types d’informations à partir d’un fichier PDF. Cette section couvre comment :

  • Extraire du texte d’un PDF. L’analyse ou l’extraction de texte est l’opération la plus populaire avec les PDF prêts à l’emploi. Vous apprendrez l’analyse de texte à partir d’un document complet, d’une page particulière ou d’une région spécifique d’une page.
  • Extraire des images du PDF. L’extraction d’images fait la même chose pour les images que l’opération ci-dessus pour le texte.
  • Extraire les polices du PDF. L’extraction de polices est une opération spécifique avec les polices dans les PDF.
  • Extraire les données du formulaire. Si vous avez un tas de documents PDF avec des formulaires, il vous faut probablement extraire les données de ces formulaires. Cet article vous aidera à comprendre comment extraire les données AcroForms avec Aspose.PDF for Python via .NET.
  • Extraire des données d’un tableau. Obtenir les données du tableau dans le document PDF.
  • Extraire les données vectorielles du PDF. Vous pouvez obtenir les données vectorielles (chemin, polygone, polyligne), telles que la position, la couleur, l’épaisseur de ligne, etc.