Analyser des documents PDF
Contents
[
Hide
]
Parse PDF documents est un terme lié à l’extraction de divers types d’informations à partir d’un fichier PDF. Cette section couvre comment :
- Extraire du texte d’un PDF. L’analyse ou l’extraction de texte est l’opération la plus populaire avec les PDF prêts à l’emploi. Vous apprendrez l’analyse de texte à partir d’un document complet, d’une page particulière ou d’une région spécifique d’une page.
- Extraire des images du PDF. L’extraction d’images fait la même chose pour les images que l’opération ci-dessus pour le texte.
- Extraire les polices du PDF. L’extraction de polices est une opération spécifique avec les polices dans les PDF.
- Extraire les données du formulaire. Si vous avez un tas de documents PDF avec des formulaires, il vous faut probablement extraire les données de ces formulaires. Cet article vous aidera à comprendre comment extraire les données AcroForms avec Aspose.PDF for Python via .NET.
- Extraire des données d’un tableau. Obtenir les données du tableau dans le document PDF.
- Extraire les données vectorielles du PDF. Vous pouvez obtenir les données vectorielles (chemin, polygone, polyligne), telles que la position, la couleur, l’épaisseur de ligne, etc.