Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
PDF/A および PDF/UA 形式では、Word 形式のドキュメントから PDF への自動変換中に満たすことができない、ドキュメントのコンテンツに関連するいくつかの要件が課されます。 PDF/A および PDF/UA に完全に準拠したドキュメントを作成するには、変換前の Word ドキュメントまたは変換後の PDF ドキュメントでこれらの要件を確認および修正する必要があります。
基本的な要件は PDF/A および PDF/UA ドキュメントの構造またはフォントに関するものであり、これについては次のセクションで検討します。
現在の要件は、PDF/A-1a、PDF/A-2a、PDF/A-4、および PDF/UA-1 形式です。
さまざまな PDF 形式標準に変換する際の Aspose.Words の動作には、いくつかの微妙な違いがあります。期待どおりの結果を得たい場合は、これらを考慮する必要があります。
ライターが適切な検証を行わずに自動プロセスを使用して構造情報または意味論的な情報を生成することはお勧めできません。
ISO 19005-2、6.7.1
以下のサブセクションでは、さまざまな PDF 形式標準とそのソリューションのオプションに変換する際の Aspose.Words の動作の微妙な違いについて説明します。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
PDF ドキュメントは、見出し、段落、表などの一連のブロックです。これらのブロックは、強くても弱くても文書構造を形成します。
PDF/A では、強い構造と弱い構造の両方が有効です。 Microsoft Word 文書は設計上弱い構造を持っており、Aspose.Words はそれぞれ弱い構造を持つ PDF を作成し、ソース文書内の段落のアウトライン レベルに応じて見出しも生成します。
構造が弱い PDF/UA-1 文書の場合は、見出し番号が隙間なく順番に並んでいることもさらに必要です。
ブロックレベルの構造は、次の 2 つの主要なパラダイムのいずれかに従います。
ISO-32000-1、14.8.4.3.5
文書セマンティクスがヘッダーの降順シーケンスを必要とする場合、そのようなシーケンスは厳密な番号順に進み、介在する見出しレベルをスキップしてはならない。 H1 H2 H3 は許可されますが、H1 H3 は許可されません。
ISO-14289-1、7.4.2
正しい出力を保証するには、ユーザーはソース文書のコンテンツが適切に編成されており、段落のアウトライン レベルが正しく指定されていることを確認する必要があります。それ以外の場合、ユーザーは出力 PDF ドキュメントの構造を確認して修正する必要があります。
Microsoft Word では、デフォルトの「見出し X」スタイルを使用してアウトライン レベルを設定できます。
さらに、「段落」ウィンドウでアウトライン レベルを確認または変更できます。
Acrobat では、「タグ」ペインで文書構造を確認または変更できます。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
現時点では、Aspose.Words はページのヘッダーとフッター、メモの区切り文字、繰り返し表のヘッダー セル、および装飾画像をアーティファクトとしてマークします。このリストは将来更新される可能性があることに注意してください。
ドキュメント内のグラフィックス オブジェクトは、次の 2 つのクラスに分類できます。
ISO-32000-1、14.8.2.2.1
ドキュメントにアーティファクトとしてマークする必要がある他のコンテンツが含まれている場合、またはアーティファクトのコンテンツのいずれかが実際のコンテンツである場合、お客様は出力 PDF でそれを修正する必要があります。
たとえば、Microsoft Word で図形を装飾としてマークできるため、それらはアーティファクトとして PDF にエクスポートされます。
出力 PDF でシェイプをアーティファクトとしてマークできます。
また、ヘッダー内のテキストを、出力 PDF 内のアーティファクトから実際のコンテンツに切り替えることもできます。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
テキスト言語は Microsoft Word ドキュメントで指定されます。 Aspose.Words は、マークされたコンテンツ シーケンスまたは Span タグに添付された Lang 属性を使用して、指定された言語を出力 PDF にエクスポートします。これは export_language_to_span_tag プロパティによって制御されます。一般に、ユーザーが Microsoft Word 経由でテキストを入力する場合、言語の問題はありません。ただし、テキストが自動的に生成される場合、言語が不正確になる可能性があります。
ファイル内のすべてのテキストのデフォルトの自然言語は、ドキュメントのカタログ辞書の Lang エントリで指定する必要があります。
ファイル内のデフォルト言語と異なるすべてのテキストコンテンツは、マークされたコンテンツシーケンスに付加された `Lang` プロパティを使用するか、構造要素辞書の Lang エントリによって示される必要があります。
ISO-19005-2、6.7.4
自然言語は宣言されなければなりません… 自然言語の変更は宣言されなければなりません。
ISO-14289-1、7.2
ユーザーは、ソース Word 文書のいずれかで言語が正しく指定されていることを確認する必要があります。
または出力された PDF ドキュメント:
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
|
Microsoft Word ドキュメントを使用すると、ユーザーは画像、図形、表に代替テキストを追加できます。 Aspose.Words は、このような代替テキストを出力 PDF にエクスポートします。
画像や数式など、コンテンツにあらかじめ定められた自然なテキスト類似物がないすべての構造要素は、構造要素辞書の Alt エントリを使用して代替テキストの説明を提供する必要があります。
注 代替説明は、不透明な非テキストコンテンツを適切に解釈するのに役立つテキスト説明を提供します。
ISO-19005-2、6.7.5
ユーザーは、ソース Word 文書のいずれかにすべての要素に代替テキストがあることを確認する必要があります。
または出力された PDF ドキュメント:
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
仕様では次のことがわかります。
カスタム文字やインライングラフィックなど、非標準的な方法で表現されるすべてのテキスト構造要素は、構造要素辞書の `ActualText` エントリを使用して置換テキストを提供する必要があります。
ISO-19005-2、6.7.7
Microsoft Word ドキュメントでは、ユーザーは置換テキストを設定できません。したがって、これを出力 PDF で確認して修正する必要があります。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-2a |
|
| PDF/UA-1 |
テキスト コンテンツ内の略語と頭字語のすべてのインスタンスは、略語または頭字語のテキスト展開を提供する E プロパティを持つ Span タグを使用して、マークされたコンテンツ シーケンスに配置する必要があります。
ISO-19005-2、6.7.8
Microsoft Word ドキュメントでは、ユーザーが略語や頭字語の拡張を設定することはできません。したがって、これを出力 PDF で確認して修正する必要があります。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
Aspose.Words を使用して PDF/A-1、PDF/A-2、PDF/A-4、または PDF/UA-1 形式に変換する場合、フォントの操作にはさまざまな微妙な違いがあります。出力ドキュメントで発生する可能性のある問題を回避したい場合は、これらを考慮する必要があります。
以下のセクションでは、そのようなニュアンスと解決策のオプションについて説明します。
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
Aspose.Words は、使用されているフォントの法的制限を検証しません。それはユーザー次第です。言い換えれば、ユーザーは Aspose.Words を使用した PDF 変換に不適切なフォントを提供すべきではありません。
無制限かつユニバーサルなレンダリングのためにファイルに合法的に埋め込むことができるフォント プログラムのみを使用するものとします。
ISO-19005-2、6.2.11.4.1; ISO-14289-1、7.21.4.1 (2 つの仕様でまったく同じ引用符)
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
|
.notdef glyph の使用は禁止されています。 .notdef glyph は、選択したフォントに存在せず、フォント フォールバック メカニズムでも解決できない文字がドキュメントに含まれている場合に表示されます。
適合ドキュメントには、テキスト レンダリング モードに関係なく、コンテンツ ストリーム内のテキスト表示演算子からの .notdef glyph への参照が含まれてはなりません。
ISO-19005-2、6.2.11.8; ISO-14289-1、7.21.8 (2 つの仕様でまったく同じ引用符)
ユーザーは、ソース Word 文書のいずれかでこれらの文字を削除または置換する必要があります。
または、「PDF 編集」ツールを使用して出力された PDF ドキュメント:
| Aspose.Words 内の PDF 標準準拠レベル | 要件の有無 |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2a |
|
| PDF/A-2b |
|
| PDF/A-4 |
|
| PDF/UA-1 |
Private Use Area (PUA) 文字は、主に「Symbol」、「Wingdings」、「Webdings」などの Windows シンボリック フォントに表示されます。 Microsoft Word 形式には、文字の実際のテキストを保存するオプションがありません。
レベル A 準拠の場合のみ、Unicode プライベート使用領域 (PUA) 内のコードにマップされている任意の文字について、ActualText エントリ ... この文字またはそのような文字のシーケンスが存在する必要があります。キャラクターはパーツです。
ISO-19005-2、6.2.11.7.3
「Segoe UI Symbol」は、シンボリック フォントの代替として使用できる Windows Unicode フォントです。
ソース Word 文書内のシンボリック フォントを Unicode フォントに置き換えます。
または、出力 PDF ドキュメントの問題のある文字に ActualText エントリを追加します。
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.