Извлечение AcroForm - Извлечение данных формы из PDF в Python

Извлечение данных из формы

Получение значений из всех полей PDF документа

Чтобы получить значения из всех полей в PDF документе, вам нужно пройти через все поля формы и затем получить значение, используя свойство Value. Получите каждое поле из коллекции Form в базовом типе поля, называемом Field, и получите доступ к его свойству value.

Следующие фрагменты кода на Python показывают, как получить значения всех полей из PDF документа.


    import aspose.pdf as ap

    # Открыть документ
    pdfDocument = ap.Document(input_file)

    # Получить значения из всех полей
    for formField in pdfDocument.form.fields:
        # Анализировать имена и значения, если нужно
        print("Имя поля : " + formField.partial_name)
        print("Значение : " + str(formField.value))