Извлечь AcroForm - извлечь данные формы из PDF на Python
Contents
[
Hide
]
Извлечение данные из Form
Получение значения всех полей в PDF‑документе
Чтобы прочитать значения из всех полей PDF‑документа, пройдите по именам полей формы и получите каждое значение из Form фасад.
Выполните следующие шаги:
- Привяжите входной PDF к
Formобъект. - Итерируйте по
field_names. - Считайте каждое значение с
get_field(). - Сохраните значения в словаре.
- Верните или обработайте извлечённые значения.
Следующий фрагмент кода Python демонстрирует этот подход.
import aspose.pdf as ap
def get_values_from_all_fields(input_file_name):
form = ap.facades.Form(input_file_name)
form_values = {}
for field_name in form.field_names:
form_values[field_name] = form.get_field(field_name)
print(form_values)
return form_values