PDF/A または PDF/UA と連携
PDF/A および PDF/UA 形式は、Word 形式の文書から PDF への自動変換中に満たせないドキュメントコンテンツに関連するいくつかの要件を意味します。 これらの要件は、完全なPDF / AおよびPDF / UA準拠文書を生成するために変換後のPDF文書または変換前のWord文書で検証し、修正する必要があります。
基本的な要件は、PDF/A と PDF/UA の文書の構造やフォントのためです。次のセクションで検討します。
文書構造要件
PDF/A-1a、PDF/A-2a、PDF/A-4、PDF/UA-1 のフォーマットは現在の条件です。
方法のニュアンスがあります Aspose.Words さまざまなPDF形式規格に変換するときに動作します。 想定した結果を取得したい場合は、考慮に入れる必要があります。
仕様は、以下を教えてくれます(詳細を見るために展開します):
適切な検証なしに自動化されたプロセスを使用して、構造的または意味のある情報を生成するためにライターにとっては不注意です。
ISO 19005-2、6.7.1
下のサブセクションは、どのようにニュアンスを記述します Aspose.Words さまざまなPDFフォーマットの基準やソリューションのオプションに変換するときに動作します。
構造のタイプ
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
PDF文書は、見出し、段落、表などのブロックの順番です。 これらのブロックは、文書構造を形成する - 強く、弱い。
強弱な構造物もPDF/Aで有効です。 Microsoft Word 文書は設計によって弱い構造を持っていて、 Aspose.Words それぞれ弱構造でPDFを作成し、ソース文書の段落の輪郭レベルに応じて見出しを生成します。
弱構造のPDF/UA-1ドキュメントでは、見出し番号がギャップなしで順に進むことが必要です。
仕様は、以下を教えてくれます(詳細を見るために展開します):
ブロックレベルの構造は、2つの主要なパラダイムの1つに従うかもしれません:
ISO-32000-1、14.8.4.3.5
PDF/UA-1 のドキュメントでは、ヘッディングレベルに関連する仕様(詳細を見るための拡張)が含まれています。
文書のセマンティックスがヘッダの降下シーケンスを必要とする場合、そのようなシーケンスは厳密な数値順で進行し、介入見出しレベルをスキップしません。 H1 H2 H3は許されませんが、H1 H3はそうではありません。
ISO-14289-1、7.4.2
正しい出力を確保するため、ユーザーは、ソース文書のコンテンツを適切に整理し、輪郭レベルが正しく段落のために指定されていることを確認する必要があります。 それ以外の場合は、出力PDF文書の構造を検証して修正する必要があります。
このブロックでは、例を確認できます。アウトラインレベルを設定する方法 Microsoft Word または出力PDF文書の構造を点検し、修正して下さい(細部を見るために拡大して下さい)。
インスタグラム Microsoft Word デフォルトでは、"Heading X" スタイルは、アウトラインレベルを設定するために使用できます。
また、「パラグラフ」ウィンドウでアウトラインレベルの確認や変更ができます。
アクロバットでは、ドキュメント構造を「タグ」ペインでチェックまたは変更できます。
コンテンツをアーティファクトとしてマークする
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
瞬間に、 Aspose.Words マークページヘッダーとフッター、セパレータ、繰り返しテーブルヘッダセル、およびアーティファクトとして装飾的な画像に注意して下さい。 このリストは今後更新される可能性があります。
仕様は、以下を教えてくれます(詳細を見るために展開します):
ドキュメント内のグラフィックオブジェクトは、2つのクラスに分けられます。
ISO-32000-1、14.8.2.2.1
文書にアーティファクトとしてマークされるべきその他のコンテンツが含まれている場合、またはアーティファクトされたコンテンツのいずれかが実際のコンテンツである場合、顧客は出力PDFでそれを修正する必要があります。
このブロックでは、例を確認できます。形状を装飾としてマークする方法 Microsoft Word または出力PDF文書のアーティファクトとして形状をマークする(詳細を見るために展開)。
たとえば、形状は装飾としてマークすることができます Microsoft Word, 従ってそれらはアーティファクトとしてPDFに輸出されます:
出力PDFのアーティファクトとして形状をマークすることができます。
また、アーティファクトから実際のコンテンツにテキストを出力PDFに切り替えることができます。
自然言語指定
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
テキスト言語の指定 Microsoft Word ドキュメント。 Aspose.Words 指定された言語を出力PDFにエクスポート Lang マークされたコンテンツシーケンスまたはスパンタグに添付された属性 – によって制御される ExportLanguageToSpanTag プロパティ. 一般的に、テキストがユーザーによって入力されたときには言語の問題はありません。 Microsoft Wordお問い合わせ しかし、テキストが自動的に生成されると言語が不正確である可能性がある。
仕様は、以下を教えてくれます(詳細を見るために展開します):
ファイルのすべてのテキストのデフォルトの自然言語は、ドキュメントのカタログ辞書のLangエントリで指定する必要があります。
デフォルト言語と異なるファイル内のすべてのテキストコンテンツは、使用して表示する必要があります `Lang` マークされたコンテンツシーケンスに添付されたプロパティ、または構造要素の辞書のLangエントリによって...
ISO-19005-2、6.7.4
また、PDF/UA-1 では、以下の仕様をお伝えします。(詳細は、下記をご覧ください。)
自然言語は宣言しなければなりません... 自然言語の変化を宣言する。
ISO日 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 時 分 分 時 分 分 時 分 時 分 分 時 分 分 時 分 分 時 時 分 分 分 時 分 時 時 分 分 時 時 時 時 分 分 時 時 時 時 時 時 分 時 時 時 時 時 時 時 時 時 時 時 時 時 分 分 時 分 分 分 時 分 時 時 分 分 時 時 時 時 時 分 時 分 時 時 分 分 時 時 時 分 分
このブロックでは、言語が正しく指定されていることを確認する方法(詳細を参照して)例を見ることができます。
ユーザーは、Word文書のいずれかで言語が正しく指定されていることを確認する必要があります。
または出力PDF文書:
図キャプション
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
Microsoft Word 文書は、ユーザーが数値キャプションを追加できるようにします。
仕様は、以下を教えてくれます(詳細を見るために展開します):
図に付随するキャプションは、キャプションタグでタグ付けします。
ISO-14289-1, 7.3
最近の投稿 Aspose.Words Captionタグでキャプションをエクスポートできないため、出力PDFにフラグを立てる必要があります。
このブロックでは、キャプション(詳細を見るためにexpand)をインサートする方法を例に示すことができます。
インスタグラム Microsoft Word, コンテキストメニューからキャプションを差し込むことができます。
アクロバットではキャプションを追加または変更することができます `Object` プロパティダイアログ:
代替説明
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
Microsoft Word 文書は、ユーザーが画像、図形、表に代替テキストを追加できるようにします。 Aspose.Words そのような代替テキストを出力PDFにエクスポートします。
仕様は、以下を教えてくれます(詳細を見るために展開します):
コンテンツが自然な前述のテキストのアナログを持っていないすべての構造要素、例えば画像、式など、構造要素の辞書のAltエントリを使用して代替テキストの説明を供給する必要があります...
お問い合わせ 代替説明は、他の不透明非テキストコンテンツの適切な解釈で役立つテキストの説明を提供します。
ISO-19005-2、6.7.5
このブロックでは、すべての要素が代替テキストを持っていることを確実にする方法(詳細を参照するために拡張)。
ユーザーは、すべての要素がソースWord文書の代替テキストを持っていることを確実にする必要があります。
または出力PDF文書:
Hyperlinksの代替説明
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
前のポイントに加えて、 Microsoft Word 文書はまた、ユーザーがハイパーリンクに代替テキストを追加できるようにします。 Aspose.Words そのような代替テキストを出力PDFにエクスポートします。
残念ながら、すべてのアプリケーションでは、代替説明を設定することができます。 例えば、 Adobe Acrobat 現在、ハイパーリンクの記述を設定することはできません。 しかし、 Microsoft Word, 次のようにします。
コンテンツ(TOC)の表に自動生成されたハイパーリンク用のaltテキストを設定できないことがあります。 Microsoft Word ログイン Aspose.Words そのようなフィールドを更新し、リンクを自分で生成できます。
更新するコード例に従ってください TOC
フィールドを使用してフィールド Aspose.Words Document Object Model ( )DOM):
Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();
for (Field field : doc.getRange().getFields()) {
if (field.getType() == FieldType.FIELD_HYPERLINK) {
FieldHyperlink hyperlink = (FieldHyperlink) field;
if (hyperlink.getFieldCode().startsWith("#_Toc")) {
tocHyperLinks.add(hyperlink);
}
}
}
for (FieldHyperlink link : tocHyperLinks)
link.setScreenTip(link.getDisplayResult());
PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);
String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);
テーブルヘッダー
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
PDF/UA-1 文書の表には、ヘッダ - 列、行、または両方が必要です。 PDF/A は標準テーブルのマークアップだけを必要とし、追加の制限はありません。 注意: Aspose.Words 標準的なテーブルマークアップを自動的に生成します。
仕様は、以下を教えてくれます(詳細を見るために展開します):
テーブルにはヘッダが含まれている必要があります... カラムヘッダ、行ヘッダ、または両方を含むことができます。
ISO-14289-1、7.5
このブロックでは、テーブルヘッダの設定方法(詳細を見るために展開)の例を確認できます。
テーブルヘッダーは、ソースのいずれかを設定できます Microsoft Word ドキュメント:
または出力PDF:
置換テキスト
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
仕様は、以下を教えてくれます(詳細を見るために展開します):
仕様は以下のとおりです。
標準でない方法で表されるすべてのテキスト構造要素、例えば、カスタム文字またはインライン グラフィックスは、代替テキストをを使用して供給する必要があります `ActualText` 構造要素辞書のエントリ...
ISO-19005-2、6.7.7
Microsoft Word ドキュメントは、ユーザーが置換テキストを設定することはできません。 そのため、出力PDFで検証および修正する必要があります。
略語と頭字語の拡張
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/UA-1 |
仕様は、以下を教えてくれます(詳細を見るために展開します):
テキストコンテンツの省略と頭字語のすべてのインスタンスは、E プロパティが省略または頭字語のテキスト拡張を提供するスパンタグでマークされたコンテンツシーケンスに配置する必要があります。
ISO-19005-2、6.7.8
Microsoft Word ドキュメントは、ユーザーが省略と頭字語の拡張を設定することはできません。 そのため、出力PDFで検証して修正する必要があります。
ドキュメントタイトル
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-2a(PDF) | |
PDFファイル/A-4 | |
PDFファイル/UA-1 |
PDF/UA-1 のドキュメントにはタイトルが必要です。 |
仕様は、以下を教えてくれます(詳細を見るために展開します):
仕様は以下のとおりです。
ドキュメントのカタログ辞書のメタデータストリームには、dc:title エントリが含まれている必要があります。dc は、ダブリンコアメタデータスキーマの推奨接頭辞です。
ISO-14289-1、7.1
このブロックでは、ドキュメントのタイトルを設定する方法(詳細を参照するための拡張)の例を見ることができます。
ドキュメントのタイトルは、ソースのいずれかを設定することができます Microsoft Word ドキュメント:
または出力PDF:
フォントの要件
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-1bの特長 | |
PDF/A-2a(PDF) | |
PDF/A-2bの特長 | |
PDFファイル/A-4 | |
PDFファイル/UA-1 |
PDF/A-1、PDF/A-2、PDF/A-4、PDF/UA-1の形式に変換すると、フォントで作業するニュアンスもいくつかあります。 Aspose.Wordsお問い合わせ 出力文書に問題が起きないようにするには、考慮に入れなければなりません。
以下のセクションでは、そのようなニュアンスとソリューションのオプションについて説明します。
フォント法的要件
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-1bの特長 | |
PDF/A-2a(PDF) | |
PDF/A-2bの特長 | |
PDFファイル/A-4 | |
PDFファイル/UA-1 |
Aspose.Words 使用されるフォントの法的制限を検証しません。それはユーザー次第です。 言い換えると、PDF変換用の不適切なフォントは使用しない Aspose.Wordsお問い合わせ
仕様は、以下を教えてくれます(詳細を見るために展開します):
法的に埋め込まれるフォントプログラムのみが、無制限の、ユニバーサルレンダリングに使用できるファイルです。
ISO-19005-2、6.2.11.4.1; ISO-14289-1, 7.21.4.1 (2つの仕様の同じ引用)
.notdefの特長 Glyph
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-1bの特長 | |
PDF/A-2a(PDF) | |
PDF/A-2bの特長 | |
PDFファイル/A-4 | |
PDFファイル/UA-1 |
利用状況 .notdef
glyph 禁止事項 ザ・オブ・ザ・ .notdef
glyph ドキュメントには、選択したフォントに存在しない文字と、フォントフォールバック機構を介して解決できない文字が含まれている場合に表示されます。
仕様は、以下を教えてくれます(詳細を見るために展開します):
準拠文書は .notdef への参照を含んでいません glyph テキストレンダリングモードに関係なく、任意のコンテンツストリームで、オペレータを示すテキストのいずれかから。
ISO-19005-2、6.2.11.8; ISO-14289-1, 7.21.8(2つの仕様の同じ引用)
このブロックでは、これらの文字を削除または置き換える例(詳細を参照するために拡張)を見ることができます。
ユーザーは、ソースWord文書のいずれかでこれらの文字を削除または置き換える必要があります。
または「PDF編集」ツールを使用して出力PDF文書:
プライベート利用エリア(PUA)
PDF標準準拠レベル Aspose.Words | 要件の存在 |
---|---|
PDF/A-1a をダウンロード | |
PDF/A-1bの特長 | |
PDF/A-2a(PDF) | |
PDF/A-2bの特長 | |
PDFファイル/A-4 | |
PDFファイル/UA-1 |
プライベート利用エリア(PUA)の文字は大抵 Windows “Symbol”, “Wingdings”, “Webdings” などのシンボリックフォント。 Microsoft Word フォーマットは実際のテキストを文字に格納するオプションを提供しません。
仕様は、以下を教えてくれます(詳細を見るために展開します):
レベルのため 適合性は、任意の文字に対してのみ、Unicode Private Use Area (PUA) のコードまたはコードにマッピングされ、ActualText エントリ... は、この文字またはそのような文字が部分である文字のシーケンスのために存在します。
ISO-19005-2、6.2.11.7.3
“「Segoe UIシンボル」は、 Windows 記号フォントの代替として使用できるUnicodeフォント。
このブロックでは、シンボリックフォント(詳細を参照するために拡張)で問題を解決するために、ユーザーが何をすべきかの例を見ることができます。
ソースWord文書のUnicode 1でシンボルフォントを置き換えます。
または、出力 PDF ドキュメントで問題のある文字に ActualText エントリを追加します。