提取 AcroForm - 在 Python 中提取 PDF 表单数据

提取表单数据

获取 PDF 文档中所有字段的值

要读取 PDF 文档中所有字段的值,遍历表单字段名称并从中检索每个值 Form 外观。

使用以下步骤:

  1. 将输入 PDF 绑定到 a Form 对象。
  2. 遍历 field_names.
  3. 使用以下方式读取每个值 get_field().
  4. 将值存储在字典中。
  5. 返回或处理提取的值。

下面的 Python 代码片段展示了此方法。

import aspose.pdf as ap


def get_values_from_all_fields(input_file_name):
    form = ap.facades.Form(input_file_name)

    form_values = {}
    for field_name in form.field_names:
        form_values[field_name] = form.get_field(field_name)

    print(form_values)
    return form_values

相关主题