PDF/AまたはPDF/UAでの作業

PDF/AおよびPDF/UA形式は、Word形式の文書からPDFへの自動変換中に満たすことができない文書の内容に関連するいくつかの要件を課します。 これらの要件は、完全にPDF/AおよびPDF/UA準拠の文書を作成するために、変換前のWord文書または変換後のPDF文書のいずれかで検証および修正する必要があり

基本的な要件は、PDF/AおよびPDF/UA文書の構造またはフォントに関するものであり、これについては次のセクションで検討します。

文書構造の要件

現在の要件は次のとおりですPDF/A-1a, PDF/A-2a, PDF/A-4, とPDF/UA-1形式。

さまざまなPDF形式の標準に変換するときにAspose.Wordsがどのように機能するかにはいくつかのニュアンスがあります。 期待される結果を得たい場合は、それらを考慮に入れる必要があります。

以下のサブセクションでは、さまざまなPDF形式の標準とそのソリューションのオプションに変換するときにAspose.Wordsがどのように機能するかに関す

構造のタイプ

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

PDFドキュメントは、見出し、段落、表などの一連のブロックです。 これらのブロックは文書構造を形成します–強くまたは弱いです。

強い構造と弱い構造の両方がPDF/Aに対して有効です。 Microsoft Word文書は設計上弱い構造を持ち、Aspose.Wordsはそれぞれ弱い構造を持つPDFを作成し、ソース文書内の段落のアウトラインレベルに従って見出しを生成します。Microsoft Word文書は設計上弱い構造を持ち、Aspose.Wordsはそれぞれ弱い構造を持つPDFを作成します。

構造が弱いPDF/UA-1文書の場合は、見出し番号がギャップなしで順番に並んでいることがさらに必要です。

正しい出力を確実にするには、ソース文書の内容が適切に整理され、段落のアウトラインレベルが正しく指定されていることを確認する必要があ それ以外の場合、ユーザーは出力PDF文書の構造を確認して修正する必要があります。

コンテンツを成果物としてマークする

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

現時点では、Aspose.Wordsはページヘッダーとフッター、ノートセパレータ、繰り返されるテーブルヘッダーセル、装飾画像をアーティファクトとしてマークします。 このリストは将来更新される可能性があることに注意してください。

ドキュメントにアーティファクトとしてマークする必要があるその他のコンテンツが含まれている場合、またはアーティファクト コンテンツのいずれかが実際のコンテンツである場合、顧客は出力 PDF でそれを修正する必要があります。

自然言語仕様

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

テキスト言語はMicrosoft Word文書で指定されています。 Aspose.Words指定された言語を出力PDFにエクスポートし、Lang属性をマークされたコンテンツシーケンスまたはSpanタグに添付します。ExportLanguageToSpanTagプロパティによって制御されます。 一般的に、Microsoft Wordを介してユーザーがテキストを入力した場合、言語の問題はありません。 ただし、テキストが自動的に生成されると、言語が不正確になる可能性があります。

図のキャプション

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word文書では、ユーザーは図のキャプションを追加できます。

現在Aspose.WordsはCaptionタグ付きのキャプションを書き出すことができないため、出力PDFでフラグを付ける必要があります。

代替の説明

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Wordドキュメントを使用すると、ユーザーは画像、図形、および表に代替テキストを追加できます。 Aspose.Wordsこのような代替テキストを出力PDFにエクスポートします。

ハイパーリンクの代替説明

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

前の点に加えて、Microsoft Wordドキュメントでは、ユーザーがハイパーリンクに代替テキストを追加することもできます。 Aspose.Wordsこのような代替テキストを出力PDFにエクスポートします。

残念ながら、すべてのアプリケーションで別の説明を設定できるわけではありません。 たとえば、Adobe Acrobatは現在、ハイパーリンクのこのような説明を設定することはできません。 ただし、Microsoft Wordでは、次のようにしてこれを行うことができます:

alternate-descriptions-hyperlinks-mw

目次(TOC)からMicrosoft WordGUIまでの自動生成されたハイパーリンクのaltテキストを設定できないという問題がある場合があります。 Aspose.Wordsはそのようなフィールドを更新し、独自にリンクを生成することができます。

コード例に従って、Aspose.Wordsドキュメントオブジェクトモデル(DOM)を使用してTOCフィールドを更新します:

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

テーブルヘッダー

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1ドキュメント内のテーブルには、列、行、またはその両方のヘッダーが必要です。 PDF/Aは標準のテーブルマークアップのみを必要としますが、これには追加の制限はありません。 Aspose.Wordsは標準テーブルマークアップを自動的に生成することに注意してください。

置換テキスト

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Wordドキュメントでは、ユーザーは置換テキストを設定できません。 したがって、これは出力PDFで確認して修正する必要があります:

AcrobatReplacementText

略語と頭字語の拡張

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Wordドキュメントでは、ユーザーが略語や頭字語の拡張を設定することはできません。 したがって、これは出力PDFで確認して修正する必要があります:

AcrobatSplitAddExpansionText

文書タイトル

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1の文書にはタイトルが必要です。

フォント要件

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

に変換するときにフォントを操作する際のニュアンスもいくつかありますPDF/A-1, PDF/A-2, PDF/A-4 またはAspose.Wordsを使用したPDF/UA-1形式。 出力文書で起こりうる問題を回避したい場合は、それらを考慮に入れる必要があります。

以下のセクションでは、そのようなニュアンスとそのソリューションのオプションについて説明します。

フォントの法的要件

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Wordsは使用されているフォントの法的制限を検証しません–それはユーザー次第です。 つまり、ユーザーはAspose.Wordsを使用してPDF変換に不適切なフォントを提供すべきではありません。

.notdefGlyph

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1 tick

.notdefグリフの使用は禁止されています。 選択したフォントに存在せず、フォントフォールバックメカニズムで解決できない文字が文書に含まれている場合、.notdefグリフが表示されます。

私用エリア(PUA)

PDFAspose.Words内の標準コンプライアンスレベル 要件の存在
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2b tick
PDF/A-4 tick
PDF/UA-1

プライベート使用領域(PUA)文字は、主に"Symbol"、“Wingdings”、“Webdings"などのWindowsシンボリックフォントに表示されます。 Microsoft Word形式では、文字の実際のテキストを格納するオプションは提供されません。

“SegoeUISymbol"は、シンボリックフォントの代替として使用できるWindowsUnicodeフォントです。