Извлечь AcroForm - извлечь данные формы из PDF на Python

Извлечение данные из Form

Получение значения всех полей в PDF‑документе

Чтобы прочитать значения из всех полей PDF‑документа, пройдите по именам полей формы и получите каждое значение из Form фасад.

Выполните следующие шаги:

  1. Привяжите входной PDF к Form объект.
  2. Итерируйте по field_names.
  3. Считайте каждое значение с get_field().
  4. Сохраните значения в словаре.
  5. Верните или обработайте извлечённые значения.

Следующий фрагмент кода Python демонстрирует этот подход.

import aspose.pdf as ap


def get_values_from_all_fields(input_file_name):
    form = ap.facades.Form(input_file_name)

    form_values = {}
    for field_name in form.field_names:
        form_values[field_name] = form.get_field(field_name)

    print(form_values)
    return form_values

Связанные темы