PDF/A または PDF/UA の操作

PDF/A および PDF/UA 形式では、Word 形式のドキュメントから PDF への自動変換中に満たすことができない、ドキュメントのコンテンツに関連するいくつかの要件が課されます。 PDF/A および PDF/UA に完全に準拠したドキュメントを作成するには、変換前の Word ドキュメントまたは変換後の PDF ドキュメントでこれらの要件を確認および修正する必要があります。

基本的な要件は PDF/A および PDF/UA ドキュメントの構造またはフォントに関するものであり、これについては次のセクションで検討します。

文書構造の要件

現在の要件は、PDF/A-1a、PDF/A-2a、PDF/A-4、および PDF/UA-1 形式です。

さまざまな PDF 形式標準に変換する際の Aspose.Words の動作には、いくつかの微妙な違いがあります。期待どおりの結果を得たい場合は、これらを考慮する必要があります。

以下のサブセクションでは、さまざまな PDF 形式標準とそのソリューションのオプションに変換する際の Aspose.Words の動作の微妙な違いについて説明します。

構造タイプ

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

PDF ドキュメントは、見出し、段落、表などの一連のブロックです。これらのブロックは、強くても弱くても文書構造を形成します。

PDF/A では、強い構造と弱い構造の両方が有効です。 Microsoft Word 文書は設計上弱い構造を持っており、Aspose.Words はそれぞれ弱い構造を持つ PDF を作成し、ソース文書内の段落のアウトライン レベルに応じて見出しも生成します。

構造が弱い PDF/UA-1 文書の場合は、見出し番号が隙間なく順番に並んでいることもさらに必要です。

正しい出力を保証するには、ユーザーはソース文書のコンテンツが適切に編成されており、段落のアウトライン レベルが正しく指定されていることを確認する必要があります。それ以外の場合、ユーザーは出力 PDF ドキュメントの構造を確認して修正する必要があります。

コンテンツをアーティファクトとしてマークする

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

現時点では、Aspose.Words はページのヘッダーとフッター、メモの区切り文字、繰り返し表のヘッダー セル、および装飾画像をアーティファクトとしてマークします。このリストは将来更新される可能性があることに注意してください。

ドキュメントにアーティファクトとしてマークする必要がある他のコンテンツが含まれている場合、またはアーティファクトのコンテンツのいずれかが実際のコンテンツである場合、お客様は出力 PDF でそれを修正する必要があります。

自然言語仕様

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

テキスト言語は Microsoft Word ドキュメントで指定されます。 Aspose.Words は、マークされたコンテンツ シーケンスまたは Span タグに添付された Lang 属性を使用して、指定された言語を出力 PDF にエクスポートします。これは ExportLanguageToSpanTag プロパティによって制御されます。一般に、ユーザーが Microsoft Word 経由でテキストを入力する場合、言語の問題はありません。ただし、テキストが自動的に生成される場合、言語が不正確になる可能性があります。

図のキャプション

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

Microsoft Word ドキュメントでは、ユーザーが図のキャプションを追加できます。

現在、Aspose.Words は Caption タグを使用してキャプションをエクスポートできないため、出力 PDF でキャプションにフラグを付ける必要があります。

代替説明

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1 tick

Microsoft Word ドキュメントを使用すると、ユーザーは画像、図形、表に代替テキストを追加できます。 Aspose.Words は、このような代替テキストを出力 PDF にエクスポートします。

ハイパーリンクの代替説明

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

前述の点に加えて、Microsoft Word ドキュメントではユーザーがハイパーリンクに代替テキストを追加することもできます。 Aspose.Words は、このような代替テキストを出力 PDF にエクスポートします。

残念ながら、すべてのアプリケーションで代替説明を設定できるわけではありません。たとえば、Adobe Acrobat では現在、ハイパーリンクにそのような説明を設定できません。ただし、Microsoft Word では次のようにこれを行うことができます。

代替説明-ハイパーリンク-mw

Microsoft Word GUI を使用して目次 (TOC) に自動生成されたハイパーリンクの代替テキストを設定できないという問題が発生することがあります。 Aspose.Words はそのようなフィールドを更新し、独自にリンクを生成できます。

コード例に従って、Aspose.Words Document Object Model (DOM) を使用して TOC フィールドを更新します。

Document doc = new Document(fileName);

	var tocHyperLinks = doc.Range.Fields
		.Where(f => f.Type == FieldType.FieldHyperlink)
		.Cast<FieldHyperlink>()
		.Where(f => f.HRef.StartsWith("#_Toc"));
	
	foreach (FieldHyperlink link in tocHyperLinks)
		link.ScreenTip = link.DisplayResult;
	
	PdfSaveOptions opt = new PdfSaveOptions()
	{
		Compliance = PdfCompliance.PdfUa1,
		DisplayDocTitle = true,
		ExportDocumentStructure = true,
	};
	opt.OutlineOptions.HeadingsOutlineLevels = 3;
	opt.OutlineOptions.CreateMissingOutlineLevels = true;
	
	var outFile = Path.ChangeExtension(fileName, "_aw.pdf");
	doc.Save(outFile, opt);

テーブルヘッダー

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-2a
PDF/UA-1 tick

PDF/UA-1 ドキュメントの表には、列、行、またはその両方のヘッダーが必要です。 PDF/A には標準のテーブル マークアップのみが必要であり、追加の制限はありません。 Aspose.Words は標準テーブル マークアップを自動的に生成することに注意してください。

置換テキスト

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word ドキュメントでは、ユーザーは置換テキストを設定できません。したがって、これを出力 PDF で確認して修正する必要があります。

Acrobat置換テキスト

略語と頭字語の拡張

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-2a tick
PDF/UA-1

Microsoft Word ドキュメントでは、ユーザーが略語や頭字語の拡張を設定することはできません。したがって、これを出力 PDF で確認して修正する必要があります。

アクロバット分割追加拡張テキスト

ドキュメントのタイトル

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-2a
PDF/A-4
PDF/UA-1 tick
PDF/UA-1 の文書にはタイトルが必要です。

フォントの要件

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words を使用して PDF/A-1、PDF/A-2、PDF/A-4、または PDF/UA-1 形式に変換する場合、フォントの操作にはさまざまな微妙な違いがあります。出力ドキュメントで発生する可能性のある問題を回避したい場合は、これらを考慮する必要があります。

以下のセクションでは、そのようなニュアンスと解決策のオプションについて説明します。

フォントの法的要件

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a tick
PDF/A-1b tick
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

Aspose.Words は、使用されているフォントの法的制限を検証しません。それはユーザー次第です。言い換えれば、ユーザーは Aspose.Words を使用した PDF 変換に不適切なフォントを提供すべきではありません。

.notdef Glyph

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1 tick

.notdef glyph の使用は禁止されています。 .notdef glyph は、選択したフォントに存在せず、フォント フォールバック メカニズムでも解決できない文字がドキュメントに含まれている場合に表示されます。

プライベート使用エリア (PUA)

Aspose.Words 内の PDF 標準準拠レベル 要件の有無
PDF/A-1a
PDF/A-1b
PDF/A-2a tick
PDF/A-2u tick
PDF/A-4 tick
PDF/UA-1

Private Use Area (PUA) 文字は、主に「Symbol」、「Wingdings」、「Webdings」などの Windows シンボリック フォントに表示されます。 Microsoft Word 形式には、文字の実際のテキストを保存するオプションがありません。

「Segoe UI Symbol」は、シンボリック フォントの代替として使用できる Windows Unicode フォントです。