提取 XFA 数据

Contents
[ ]

XFA(XML Forms Architecture)表单不同于传统的 AcroForm,因为它们的数据存储在 PDF 内部的 XML 中。在本示例中, Form 对象来自于 aspose.pdf.facades 模块用于绑定 PDF 并将其 XFA 数据直接提取到文件中。

  1. 创建 pdf_facades.Form() 的实例以管理表单数据。
  2. 调用 ‘bind_pdf()’ 以附加包含 XFA 表单的源 PDF。
  3. 使用 ‘FileIO()’ 创建可写文件流。
  4. 调用 ’extract_xfa_data()’ 导出嵌入的 XFA XML 数据。
from io import FileIO
import sys
from os import path
import aspose.pdf as ap
import aspose.pdf.facades as pdf_facades

sys.path.append(path.join(path.dirname(__file__), ".."))

from config import set_license, initialize_data_dir


# Extract XFA Data
def export_xfa_data(infile, outfile):
    """Export XFA form data."""
    # Create Form object
    form = pdf_facades.Form()

    # Bind PDF document
    form.bind_pdf(infile)

    with FileIO(outfile, "w") as stream:
        # Export embedded XFA XML data to the output stream
        form.extract_xfa_data(stream)