PDF/A または PDF/UA と連携

PDF/A および PDF/UA 形式は、Word 形式の文書から PDF への自動変換中に満たせないドキュメントコンテンツに関連するいくつかの要件を意味します。 これらの要件は、完全なPDF / AおよびPDF / UA準拠文書を生成するために変換後のPDF文書または変換前のWord文書で検証し、修正する必要があります。

基本的な要件は、PDF/A と PDF/UA の文書の構造やフォントのためです。次のセクションで検討します。

文書構造要件

PDF/A-1a、PDF/A-2a、PDF/A-4、PDF/UA-1 のフォーマットは現在の条件です。

方法のニュアンスがあります Aspose.Words さまざまなPDF形式規格に変換するときに動作します。 想定した結果を取得したい場合は、考慮に入れる必要があります。

下のサブセクションは、どのようにニュアンスを記述します Aspose.Words さまざまなPDFフォーマットの基準やソリューションのオプションに変換するときに動作します。

構造のタイプ

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1 tick

PDF文書は、見出し、段落、表などのブロックの順番です。 これらのブロックは、文書構造を形成する - 強く、弱い。

強弱な構造物もPDF/Aで有効です。 Microsoft Word 文書は設計によって弱い構造を持っていて、 Aspose.Words それぞれ弱構造でPDFを作成し、ソース文書の段落の輪郭レベルに応じて見出しを生成します。

弱構造のPDF/UA-1ドキュメントでは、見出し番号がギャップなしで順に進むことが必要です。

正しい出力を確保するため、ユーザーは、ソース文書のコンテンツを適切に整理し、輪郭レベルが正しく段落のために指定されていることを確認する必要があります。 それ以外の場合は、出力PDF文書の構造を検証して修正する必要があります。

コンテンツをアーティファクトとしてマークする

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1 tick

瞬間に、 Aspose.Words マークページヘッダーとフッター、セパレータ、繰り返しテーブルヘッダセル、およびアーティファクトとして装飾的な画像に注意して下さい。 このリストは今後更新される可能性があります。

文書にアーティファクトとしてマークされるべきその他のコンテンツが含まれている場合、またはアーティファクトされたコンテンツのいずれかが実際のコンテンツである場合、顧客は出力PDFでそれを修正する必要があります。

自然言語指定

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1 tick

テキスト言語の指定 Microsoft Word ドキュメント。 Aspose.Words 指定された言語を出力PDFにエクスポート Lang マークされたコンテンツシーケンスまたはスパンタグに添付された属性 – によって制御される ExportLanguageToSpanTag プロパティ. 一般的に、テキストがユーザーによって入力されたときには言語の問題はありません。 Microsoft Wordお問い合わせ しかし、テキストが自動的に生成されると言語が不正確である可能性がある。

図キャプション

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-2a(PDF)
PDFファイル/UA-1 tick

Microsoft Word 文書は、ユーザーが数値キャプションを追加できるようにします。

最近の投稿 Aspose.Words Captionタグでキャプションをエクスポートできないため、出力PDFにフラグを立てる必要があります。

代替説明

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1 tick

Microsoft Word 文書は、ユーザーが画像、図形、表に代替テキストを追加できるようにします。 Aspose.Words そのような代替テキストを出力PDFにエクスポートします。

Hyperlinksの代替説明

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-2a(PDF)
PDFファイル/UA-1 tick

前のポイントに加えて、 Microsoft Word 文書はまた、ユーザーがハイパーリンクに代替テキストを追加できるようにします。 Aspose.Words そのような代替テキストを出力PDFにエクスポートします。

残念ながら、すべてのアプリケーションでは、代替説明を設定することができます。 例えば、 Adobe Acrobat 現在、ハイパーリンクの記述を設定することはできません。 しかし、 Microsoft Word, 次のようにします。

alternate-descriptions-hyperlinks-mw

コンテンツ(TOC)の表に自動生成されたハイパーリンク用のaltテキストを設定できないことがあります。 Microsoft Word ログイン Aspose.Words そのようなフィールドを更新し、リンクを自分で生成できます。

更新するコード例に従ってください TOC フィールドを使用してフィールド Aspose.Words Document Object Model ( )DOM):

Document doc = new Document(fileName);
ArrayList<FieldHyperlink> tocHyperLinks = new ArrayList<>();

for (Field field : doc.getRange().getFields()) {
    if (field.getType() == FieldType.FIELD_HYPERLINK) {
        FieldHyperlink hyperlink = (FieldHyperlink) field;
        if (hyperlink.getFieldCode().startsWith("#_Toc")) {
            tocHyperLinks.add(hyperlink);
        }
    }
}

for (FieldHyperlink link : tocHyperLinks)
    link.setScreenTip(link.getDisplayResult());

PdfSaveOptions opt = new PdfSaveOptions();
opt.setCompliance(PdfCompliance.PDF_UA_1);
opt.setDisplayDocTitle(true);
opt.setExportDocumentStructure(true);
opt.getOutlineOptions().setHeadingsOutlineLevels(3);
opt.getOutlineOptions().setCreateMissingOutlineLevels(true);

String outFile = fileName.substring(0,fileName.lastIndexOf('.')) + "_aw.pdf";
doc.save(outFile, opt);

テーブルヘッダー

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-2a(PDF)
PDFファイル/UA-1 tick

PDF/UA-1 文書の表には、ヘッダ - 列、行、または両方が必要です。 PDF/A は標準テーブルのマークアップだけを必要とし、追加の制限はありません。 注意: Aspose.Words 標準的なテーブルマークアップを自動的に生成します。

置換テキスト

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1

Microsoft Word ドキュメントは、ユーザーが置換テキストを設定することはできません。 そのため、出力PDFで検証および修正する必要があります。

AcrobatReplacementText

略語と頭字語の拡張

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-2a(PDF) tick
PDFファイル/UA-1

Microsoft Word ドキュメントは、ユーザーが省略と頭字語の拡張を設定することはできません。 そのため、出力PDFで検証して修正する必要があります。

AcrobatSplitAddExpansionText

ドキュメントタイトル

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-2a(PDF)
PDFファイル/A-4
PDFファイル/UA-1 tick
PDF/UA-1 のドキュメントにはタイトルが必要です。

フォントの要件

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-1bの特長 tick
PDF/A-2a(PDF) tick
PDF/A-2bの特長 tick
PDFファイル/A-4 tick
PDFファイル/UA-1 tick

PDF/A-1、PDF/A-2、PDF/A-4、PDF/UA-1の形式に変換すると、フォントで作業するニュアンスもいくつかあります。 Aspose.Wordsお問い合わせ 出力文書に問題が起きないようにするには、考慮に入れなければなりません。

以下のセクションでは、そのようなニュアンスとソリューションのオプションについて説明します。

フォント法的要件

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード tick
PDF/A-1bの特長 tick
PDF/A-2a(PDF) tick
PDF/A-2bの特長 tick
PDFファイル/A-4 tick
PDFファイル/UA-1 tick

Aspose.Words 使用されるフォントの法的制限を検証しません。それはユーザー次第です。 言い換えると、PDF変換用の不適切なフォントは使用しない Aspose.Wordsお問い合わせ

.notdefの特長 Glyph

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-1bの特長
PDF/A-2a(PDF) tick
PDF/A-2bの特長 tick
PDFファイル/A-4 tick
PDFファイル/UA-1 tick

利用状況 .notdef glyph 禁止事項 ザ・オブ・ザ・ .notdef glyph ドキュメントには、選択したフォントに存在しない文字と、フォントフォールバック機構を介して解決できない文字が含まれている場合に表示されます。

プライベート利用エリア(PUA)

PDF標準準拠レベル Aspose.Words 要件の存在
PDF/A-1a をダウンロード
PDF/A-1bの特長
PDF/A-2a(PDF) tick
PDF/A-2bの特長 tick
PDFファイル/A-4 tick
PDFファイル/UA-1

プライベート利用エリア(PUA)の文字は大抵 Windows “Symbol”, “Wingdings”, “Webdings” などのシンボリックフォント。 Microsoft Word フォーマットは実際のテキストを文字に格納するオプションを提供しません。

“「Segoe UIシンボル」は、 Windows 記号フォントの代替として使用できるUnicodeフォント。