Analyser des documents PDF

Parse PDF documents est un terme lié à l’extraction de divers types d’informations à partir d’un fichier PDF. Cette section couvre comment :

Extraire du texte d’un PDF. L’analyse ou l’extraction de texte est l’opération la plus populaire avec les PDF prêts à l’emploi. Vous apprendrez l’analyse de texte à partir d’un document complet, d’une page particulière ou d’une région spécifique d’une page.
Extraire des images du PDF. L’extraction d’images fait la même chose pour les images que l’opération ci-dessus pour le texte.
Extraire les polices du PDF. L’extraction de polices est une opération spécifique avec les polices dans les PDF.
Extraire les données du formulaire. Si vous avez un tas de documents PDF avec des formulaires, il vous faut probablement extraire les données de ces formulaires. Cet article vous aidera à comprendre comment extraire les données AcroForms avec Aspose.PDF for Python via .NET.
Extraire des données d’un tableau. Obtenir les données du tableau dans le document PDF.
Extraire les données vectorielles du PDF. Vous pouvez obtenir les données vectorielles (chemin, polygone, polyligne), telles que la position, la couleur, l’épaisseur de ligne, etc.