ドキュメントを HTML、MHTML、または EPUB に変換する

HTML および MHTML フロー レイアウト形式のドキュメントも非常に人気があり、あらゆる Web プラットフォームで使用できます。そのため、ドキュメントを HTML および MHTML に変換することは、Aspose.Words の重要な機能です。

EPUB (「Electronic Publication」の略) は、電子書籍の配布に一般的に使用される HTML ベースの形式です。この形式は、ほとんどの読書デバイスと互換性のある電子書籍のエクスポート用に Aspose.Words で完全にサポートされています。

ドキュメントを変換する

HTML、MHTML、または EPUB への単純な変換には、Save メソッド オーバーロードの 1 つが使用されます。ドキュメントをファイルまたはストリームに保存し、出力ドキュメントの保存形式を明示的に設定したり、ファイル名拡張子から定義したりできます。

次の例は、保存形式を指定して DOCX を HTML に変換する方法を示しています。

.NET

// Load the document from disk.
Document doc = new Document(dataDir + "Test File.docx");

// Save the document into HTML.
doc.Save(dataDir + "Document", SaveFormat.Html);

ドキュメントを MHTML または EPUB に変換するには、それぞれ SaveFormat.Mhtml または SaveFormat.Epub を使用します。

ラウンドトリップ情報を含むドキュメントの変換

HTML 形式は多くの Microsoft Word 機能をサポートしていないため、ドキュメント モデルをできるだけオリジナルに近づける必要がある場合は、HTML ファイル内に追加情報を保存する必要があります。このような情報は「ラウンドトリップ情報」とも呼ばれます。この目的のために、Aspose.Words は、ExportRoundtripInformation プロパティを使用して HTML、MHTML、または EPUB に保存するときにラウンドトリップ情報をエクスポートする機能を提供します。ラウンドトリップ情報を保存すると、リストされた形式のドキュメントを Document オブジェクトにロードするときに、タブ、コメント、ヘッダー、フッターなどのドキュメント プロパティを復元できます。

デフォルト値は、HTML の場合は true、MHTML および EPUB の場合は false です。

  • true の場合、ラウンドトリップ情報は - aw - * 対応する HTML 要素の CSS プロパティとしてエクスポートされます
  • falseの場合、生成されるファイルに出力されるラウンドトリップ情報はありません

次のコード例は、ドキュメントを DOCX から HTML に変換するときにラウンドトリップ情報をエクスポートする方法を示しています。

HTML への変換時の保存オプションの指定

Aspose.Words では、デフォルトまたはカスタムの保存オプションを使用して Word 文書を HTML に変換できます。カスタム保存オプションの例をいくつか以下に説明します。

リソースを保存するフォルダーを指定する

Aspose.Words を使用すると、ドキュメントを HTML に変換するときに、画像、フォント、外部 CSS などのすべてのリソースが保存される物理フォルダーを指定できます。デフォルトでは、これは空の文字列です。

ResourceFolder プロパティを指定することは、すべてのリソースを書き込むフォルダーを設定する最も簡単な方法です。フォントを指定したフォルダーに保存する FontsFolder や画像を指定したフォルダーに保存する ImagesFolder など、個別のプロパティを使用できます。相対パスが指定されている場合、FontsFolderImagesFolder はコード アセンブリが配置されているフォルダーを参照し、ResourceFolderCssStyleSheetFileName は HTML ドキュメントが配置されている出力フォルダーを参照します。

この例では、ResourceFolder は相対パスを指定します。このパスは、HTML ドキュメントが保存される出力フォルダーを指します。 ResourceFolderAlias プロパティの値は、すべてのリソースの URL を作成するために使用されます。

次のコード例は、これらのプロパティを操作する方法を示しています。

ResourceFolderAlias プロパティを使用すると、HTML ドキュメントに書き込まれるすべてのリソースの URI を構築するために使用されるフォルダーの名前を指定することもできます。これは、すべてのリソース ファイルに対して URI を生成する方法を指定する最も簡単な方法です。同じ情報を、それぞれ ImagesFolderAlias プロパティと FontsFolderAlias プロパティを介して画像とフォントに個別に指定できます。

ただし、CSS には個別のプロパティはありません。 FontsFolderFontsFolderAliasImagesFolderImagesFolderAlias、および CssStyleSheetFileName プロパティの動作は変更されません。 CssStyleSheetFileName プロパティはフォルダー名とファイル名の両方の指定に使用されることに注意してください。

  • ResourceFolder は、FontsFolderImagesFolder、および CssStyleSheetFileName で指定されたフォルダーよりも優先度が低くなります。 ResourceFolder で指定したフォルダーが存在しない場合は、自動的に作成されます。
  • ResourceFolderAliasFontsFolderAliasImagesFolderAlias よりも優先順位が低くなります。 ResourceFolderAlias が空の場合、ResourceFolder プロパティの値を使用してリソース URI が作成されます。 ResourceFolderAlias が「.」に設定されている場合(ドット) の場合、リソース URI にはパスを指定せずにファイル名のみが含まれます。

Base64 エンコーディング フォント リソースのエクスポート

Aspose.Words は、フォント リソースを Base64 エンコーディングで HTML に埋め込むかどうかを指定する機能を提供します。これを実行するには、ExportFontsAsBase64 プロパティを使用します。これは ExportFontResources プロパティの拡張機能です。デフォルトでは、その値は false で、フォントは別のファイルに書き込まれます。ただし、このオプションが true に設定されている場合、フォントは Base64 エンコーディングでドキュメントの CSS に埋め込まれます。 フォントをBase64としてエクスポート プロパティは HTML 形式にのみ影響し、EPUB および MHTML には影響しません。

次のコード例は、Base64 でエンコードされたフォントを HTML にエクスポートする方法を示しています。

EPUB への変換時の保存オプションの指定

Aspose.Words では、デフォルトまたはカスタムの保存オプションを使用して Word 文書を EPUB 形式に変換できます。 HtmlSaveOptions のインスタンスを Save メソッドに渡すことで、いくつかのオプションを指定できます。

次のコード例は、いくつかのカスタム保存オプションを指定して Word 文書を EPUB に変換する方法を示しています。

関連項目