将文档转换为HTML、MHTML或EPUB

HTML和MHTML流布局格式的文档也非常流行,可以在任何web平台上使用。 因此,将文档转换为HTML和MHTML是Aspose.Words的一个重要功能。

EPUB(简称"电子出版物")是一种基于HTML的格式,通常用于电子书分发。 Aspose.Words中完全支持此格式,用于导出与大多数阅读设备兼容的电子书。

转换文档

对于简单转换为HTML、MHTML或EPUB,使用Save方法重载之一。 您可以将文档保存到文件或流中,并显式设置输出文档保存格式或从文件扩展名中定义它。

下面的示例演示如何通过指定保存格式将DOCX转换为HTML:

要将文档转换为MHTML或EPUB,请分别使用SaveFormat.MhtmlSaveFormat.Epub

转换包含往返信息的文档

HTML格式不支持许多Microsoft Word功能,如果我们需要恢复尽可能接近原始的文档模型,我们需要在HTML文件中保存一些额外的信息。 此类信息也称为"往返信息"。 为此,Aspose.Words提供了在使用ExportRoundtripInformation属性保存到HTML、MHTML或EPUB时导出往返信息的功能。 保存往返信息允许在将列出格式的文档加载回Document对象期间还原文档属性,如选项卡、注释、页眉和页脚。

对于HTML,默认值为true,对于MHTML和EPUB,默认值为false:

  • true时,往返信息导出为相应HTML元素的-aw-*CSS属性
  • false时,没有往返信息要输出到生成的文件中

下面的代码示例演示如何在将文档从DOCX转换为HTML时导出往返信息:

转换为HTML时指定保存选项

Aspose.Words允许使用默认或自定义保存选项将Word文档转换为HTML。 下面介绍了一些自定义保存选项的示例。

指定用于保存资源的文件夹

使用Aspose.Words,我们可以指定一个物理文件夹,当文档转换为HTML时,保存所有资源,如图像,字体和外部CSS。 默认情况下,这是一个空字符串。

指定ResourceFolder属性是设置应写入所有资源的文件夹的最简单方法。 我们可以使用单个属性,例如FontsFolder将字体保存到指定文件夹,ImagesFolder将图像保存到指定文件夹。 指定相对路径时,FontsFolderImagesFolder指代码程序集所在的文件夹,ResourceFolderCssStyleSheetFileName指HTML文档所在的输出文件夹。

在此示例中,ResourceFolder指定相对路径。 此路径指向保存HTML文档的输出文件夹。 ResourceFolderAlias属性的值用于为所有资源创建URLs。

下面的代码示例演示如何使用这些属性:

使用ResourceFolderAlias属性,我们还可以指定用于构造写入HTML文档的所有资源的URIs的文件夹的名称。 这是指定如何为所有资源文件生成URIs的最简单方法。 可以分别通过ImagesFolderAliasFontsFolderAlias属性为图像和字体指定相同的信息。

但是,CSS没有单独的属性。 的行为FontsFolder, FontsFolderAlias, ImagesFolder, ImagesFolderAliasCssStyleSheetFileName属性不更改。 请注意,CssStyleSheetFileName属性用于指定文件夹名和文件名。

  • ResourceFolder的优先级低于通过FontsFolderImagesFolderCssStyleSheetFileName指定的文件夹。 如果ResourceFolder中指定的文件夹不存在,它将自动创建。
  • ResourceFolderAlias的优先级低于FontsFolderAliasImagesFolderAlias。 如果ResourceFolderAlias为空,则ResourceFolder属性的值将用于创建资源URIs。 如果ResourceFolderAlias设置为"."(点),则资源URIs将只包含文件名而不指定路径。

导出Base64编码字体资源

Aspose.Words提供了在Base64编码中指定字体资源是否应嵌入到HTML中的功能。 要执行此操作,请使用ExportFontsAsBase64属性-这是ExportFontResources属性的扩展。 默认情况下,它的值为false,字体被写入单独的文件中。 但是,如果此选项设置为true,字体将以Base64编码嵌入到文档的CSS中。 ExportFontsAsBase64属性仅影响HTML格式,不影响EPUB和MHTML。

下面的代码示例演示如何将Base64编码的字体导出到HTML:

转换为EPUB时指定保存选项

Aspose.Words允许使用默认或自定义保存选项将Word文档转换为EPUB格式。 您可以通过将HtmlSaveOptions的实例传递给Save方法来指定多个选项。

下面的代码示例演示如何通过指定一些自定义保存选项将Word文档转换为EPUB: