Extraire AcroForm - Extraire les données du formulaire du PDF en Python

Extraire les données du Form

Obtenir les valeurs de tous les champs d’un document PDF

Pour lire les valeurs de tous les champs d’un document PDF, parcourez les noms des champs du formulaire et récupérez chaque valeur depuis le Form façade.

Utilisez les étapes suivantes :

  1. Lier le PDF d’entrée à un Form objet.
  2. Parcourir field_names.
  3. Lire chaque valeur avec get_field().
  4. Stocker les valeurs dans un dictionnaire.
  5. Retourner ou traiter les valeurs extraites.

L’extrait de code Python suivant montre cette approche.

import aspose.pdf as ap


def get_values_from_all_fields(input_file_name):
    form = ap.facades.Form(input_file_name)

    form_values = {}
    for field_name in form.field_names:
        form_values[field_name] = form.get_field(field_name)

    print(form_values)
    return form_values

Sujets associés