AcroFormを抽出 - PythonでPDFからフォームデータを抽出

フォームからデータを抽出する

PDFドキュメントのすべてのフィールドから値を取得する

PDFドキュメントのすべてのフィールドから値を取得するには、すべてのフォームフィールドをナビゲートし、Valueプロパティを使用して値を取得する必要があります。フォームコレクションから各フィールドを取得し、Fieldと呼ばれる基本フィールドタイプでそのvalueプロパティにアクセスします。

以下のPythonコードスニペットは、PDFドキュメントからすべてのフィールドの値を取得する方法を示しています。


    import aspose.pdf as ap

    # ドキュメントを開く
    pdfDocument = ap.Document(input_file)

    # すべてのフィールドから値を取得する
    for formField in pdfDocument.form.fields:
        # 必要に応じて名前と値を分析する
        print("フィールド名 : " + formField.partial_name)
        print("値 : " + str(formField.value))