将PDF转换为PDF/A格式的Python代码

Aspose.PDF for Python 允许您将PDF文件转换为符合PDF/A标准的PDF文件。在此之前,文件必须经过验证。本主题将解释如何进行。

使用Document类的Convert方法转换文件。 在将 PDF 转换为符合 PDF/A 的文件之前,使用 Validate 方法验证 PDF。验证结果存储在一个 XML 文件中,然后此结果也传递给 Convert 方法。您还可以使用 ConvertErrorAction 枚举指定无法转换的元素的操作。

将 PDF 文件转换为 PDF/A-1b

以下代码片段展示了如何将 PDF 文件转换为符合 PDF/A-1b 的 PDF。

from asposepdf import Api

DIR_INPUT = "testdata/"
DIR_OUTPUT = "testout/"
input_pdf = DIR_INPUT + "Hello.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_pdfa.pdf"
output_log = DIR_OUTPUT + "convert_pdf_to_pdfa.log"
# 打开 PDF 文档
document = Api.Document(input_pdf)
# 转换为符合 PDF/A 的文档
document.convert(output_log, Api.PdfFormat.PDF_A_1B, Api.ConvertErrorAction.Delete)
# 保存输出文档
document.save(output_pdf)