提取 AcroForm - 在 Python 中提取 PDF 表单数据
Contents
[
Hide
]
提取表单数据
获取 PDF 文档中所有字段的值
要读取 PDF 文档中所有字段的值,遍历表单字段名称并从中检索每个值 Form 外观。
使用以下步骤:
- 将输入 PDF 绑定到 a
Form对象。 - 遍历
field_names. - 使用以下方式读取每个值
get_field(). - 将值存储在字典中。
- 返回或处理提取的值。
下面的 Python 代码片段展示了此方法。
import aspose.pdf as ap
def get_values_from_all_fields(input_file_name):
form = ap.facades.Form(input_file_name)
form_values = {}
for field_name in form.field_names:
form_values[field_name] = form.get_field(field_name)
print(form_values)
return form_values