Extraer AcroForm - Extraer datos de Form de PDF en Python

Extraer datos de Form

Obtener valores de todos los campos en un documento PDF

Para leer los valores de todos los campos en un documento PDF, itere a través de los nombres de los campos del formulario y recupere cada valor del Form fachada.

Utilice los siguientes pasos:

  1. Vincular el PDF de entrada a un Form objeto.
  2. Iterar a través de field_names.
  3. Lea cada valor con get_field().
  4. Almacenar valores en un diccionario.
  5. Devolver o procesar los valores extraídos.

El siguiente fragmento de código Python muestra este enfoque.

import aspose.pdf as ap


def get_values_from_all_fields(input_file_name):
    form = ap.facades.Form(input_file_name)

    form_values = {}
    for field_name in form.field_names:
        form_values[field_name] = form.get_field(field_name)

    print(form_values)
    return form_values

Temas relacionados