Extraire AcroForm - Extraire les données de formulaire d'un PDF en Python

Extraire des données du formulaire

Obtenir les valeurs de tous les champs du document PDF

Pour obtenir les valeurs de tous les champs dans un document PDF, vous devez naviguer à travers tous les champs de formulaire et ensuite obtenir la valeur en utilisant la propriété Value. Obtenez chaque champ de la collection Form, dans le type de champ de base appelé Field et accédez à sa propriété value.

Les extraits de code Python suivants montrent comment obtenir les valeurs de tous les champs d’un document PDF.


    import aspose.pdf as ap

    # Ouvrir le document
    pdfDocument = ap.Document(input_file)

    # Obtenir les valeurs de tous les champs
    for formField in pdfDocument.form.fields:
        # Analyser les noms et les valeurs si nécessaire
        print("Nom du champ : " + formField.partial_name)
        print("Valeur : " + str(formField.value))