Extrair AcroForm - Extrair Dados de Form de PDF em Python

Extrair Dados de Form

Obter valores de todos os campos em um documento PDF

Para ler valores de todos os campos em um documento PDF, itere pelos nomes dos campos de formulário e recupere cada valor do Form facade.

Use os passos a seguir:

  1. Vincular o PDF de entrada a um Form objeto.
  2. Iterar através de field_names.
  3. Leia cada valor com get_field().
  4. Armazene valores em um dicionário.
  5. Retornar ou processar os valores extraídos.

O trecho de código Python a seguir demonstra essa abordagem.

import aspose.pdf as ap


def get_values_from_all_fields(input_file_name):
    form = ap.facades.Form(input_file_name)

    form_values = {}
    for field_name in form.field_names:
        form_values[field_name] = form.get_field(field_name)

    print(form_values)
    return form_values

Tópicos Relacionados