与PDF/A或PDF/UA合作

PDF/A和PDF/UA格式规定了与文件内容有关的若干要求,这些要求在从Word格式的文档自动转换为PDF时无法满足. 应在转换前在Word文件中或在转换后在PDF文件中核实和纠正这些要求,以便产生完全符合PDF/A和PDF/UA要求的文件。

基本要求是PDF/A和PDF/UA文件的结构或字体,我们将在以下各节审议。

文件结构要求

目前所需经费用于PDF/A-1a、PDF/A-2a、PDF/A-4和PDF/UA-1格式。

有一些细微的 如何 Aspose.Words 转换到各种 PDF 格式标准时有效。 如果你想得到预期的结果,就必须考虑这些结果。

以下各小节描述了如何在下列方面的细微差别: Aspose.Words 转换为 PDF 格式标准和解决方案选项时起作用。

结构类型

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图 tick

PDF文档是标题、段落、表格等块的顺序。 这些块构成一个文件结构–强或弱.

强弱结构对PDF/A都是有效的. Microsoft Word 文档设计结构薄弱, Aspose.Words 分别创建结构薄弱的PDF,并根据源文档段落的大纲级别生成标题.

对于结构薄弱的PDF/UA-1文件,还要求标题数字保持无空白。

为了确保正确的输出,用户必须确保源文档内容有适当的组织,并正确为段落指定大纲级别. 否则,用户应当核查并固定输出PDF文件的结构.

将内容标为艺术

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图 tick

现在 Aspose.Words 标记页头和页脚,注释分隔符,重复的表格页头单元格,以及装饰图像。 请注意,这一清单今后可能会更新。

如果文件包含任何其他应标为文物的内容,或者如果任何文物内容是真实内容,客户应当在输出的PDF中予以固定.

自然语言规格

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图 tick

文本语言在 Microsoft Word 文档。 Aspose.Words 导出指定语言到带有 PDF 的输出 Lang 附加在标记内容序列或Span标签上的属性 - 由 ExportLanguageToSpanTag 属性。 通常用户通过 Microsoft Word。 。 。 但是,如果文本是自动生成的,语言可能不准确.

图说明

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-2a
PDF/UA-1 地图 tick

Microsoft Word 文档允许用户添加图表标题。

现 Aspose.Words 无法用 Caption 标记导出标题, 因此必须在输出 PDF 中标出 。

备选说明

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图 tick

Microsoft Word 文档允许用户在图像、形状和表格中添加替代文本。 Aspose.Words 将这样的替代文本导出到输出 PDF 。

超链接的替代描述

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-2a
PDF/UA-1 地图 tick

除了前一点, Microsoft Word 文档还允许用户在超链接中添加替代文本。 Aspose.Words 将这样的替代文本导出到输出 PDF 。

不幸的是,并不是每个应用程序都允许您另立一个描述. 举例来说, Adobe Acrobat 目前无法为超链接设置这样的描述。 不过在 Microsoft Word, 您可通过以下方式做到这一点:

alternate-descriptions-hyperlinks-mw

有时有一个问题,即不可能通过目录(TOC)设置自动生成超链接的备选案文。 Microsoft Word 图形用户界面. Aspose.Words 可自行更新这些字段并生成链接。

遵循代码示例进行更新 TOC 使用 Aspose.Words Document Object Model (单位:千美元)DOM:

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

表格头

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-2a
PDF/UA-1 地图 tick

PDF/UA-1文档中的表格必须有标题 – 列,行,或两者兼有. PDF/A只需要标准表标注,没有额外的限制. 请注意: Aspose.Words 自动生成标准表格标记。

替换文本

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图

Microsoft Word 文档不允许用户设置替换文本。 因此,这需要在输出的 PDF 中被验证和固定:

AcrobatReplacementText

简称和缩略语

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-2a tick
PDF/UA-1 地图

Microsoft Word 文档不允许用户设置缩写和缩写扩展。 因此这需要在输出 PDF 中进行校验和固定:

AcrobatSplitAddExpansionText

文件标题

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-2a
专题报告/A-4
PDF/UA-1 地图 tick
PDF/UA-1号文件应有一个标题。

字体要求

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-1b tick
专题报告/A-2a tick
专题报告/A-2b tick
专题报告/A-4 tick
PDF/UA-1 地图 tick

在转换为PDF/A-1、PDF/A-2、PDF/A-4或PDF/UA-1格式时,也有一些细微差别。 Aspose.Words。 。 。 如果要避免输出文档中可能出现的问题,必须将它们考虑在内。

以下各节叙述这些细微差别和解决办法。

字体 法律要求

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a tick
专题报告/A-1b tick
专题报告/A-2a tick
专题报告/A-2b tick
专题报告/A-4 tick
PDF/UA-1 地图 tick

Aspose.Words 不验证使用过的字体的法律限制 – 取决于用户。 换句话说,用户不应为PDF转换提供不适当的字体 Aspose.Words。 。 。 。

.不设防 Glyph

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-1b
专题报告/A-2a tick
专题报告/A-2b tick
专题报告/A-4 tick
PDF/UA-1 地图 tick

使用 .notdef glyph 禁止进入。 那个 .notdef glyph 如果文档中含有选定字体中不存在且无法通过字体折返机制解决的字符,则会出现。

私用区域( PUA)

PDF 内部标准遵守水平 Aspose.Words 有无要求
专题报告/A-1a
专题报告/A-1b
专题报告/A-2a tick
专题报告/A-2b tick
专题报告/A-4 tick
PDF/UA-1 地图

私用区域( PUA) 字符主要用于 Windows 符号字体如"Symbol”,“Wingdings”,“Webdings"等. Microsoft Word 格式不提供为字符存储实际文本的选项。

“Segoe UI符号"是一个 Windows 可用作符号字体替代的 Unicode 字体 。