用 Python 将 EPUB 转换为 DOCX
将 EPUB 转换为 DOCX,可以利用 DOCX 格式丰富的格式和编辑功能,使其成为从电子书内容创建专业、可编辑文档的理想选择。DOCX 文件受到广泛支持,可在不同平台和设备上轻松共享,确保了可访问性和便利性。
Aspose.HTML for Python via .NET 提供了一种简单高效的方法,使用转换器类的 convert_epub() 方法来执行这种转换。
本文将介绍如何使用 Aspose.HTML Python 库将 EPUB 转换为 DOCX 以及如何应用 DocSaveOptions。
要继续学习本教程,请在 Python 项目中 通过 .NET 安装和配置 Aspose.HTML for Python。
在线 EPUB 转换器
使用 Aspose.HTML for Python 通过 .NET 将 EPUB 文件实时转换为其他格式。转换器](5) 类的静态方法主要用于将 EPUB 文件转换为各种格式的最简单方法。只需从本地驱动器或 URL 中加载 EPUB 文件,并运行默认保存选项的转换示例。结果将立即以单独文件的形式呈现。
如果你想使用 DocSaveOptions以编程方式将 EPUB 转换为 DOCX,请参阅以下 Python 代码示例。
将 EPUB 转换为 DOCX
有了Aspose.HTML for Python via .NET,您就可以通过编程将EPUB转换为DOCX格式,并完全控制各种转换参数。要通过指定 DocSaveOptions将 EPUB 转换为 DOCX,您需要遵循以下几个步骤:
- 打开现有 EPUB 文件
- 创建一个新的 DocSaveOptions 对象,并指定所需的保存选项。
- 使用 convert_epub() 方法之一将 EPUB 保存为 DOCX 文件。
下面的示例展示了如何使用 DocSaveOptions 并创建带有自定义保存选项的 DOCX 文件:
1# Convert EPUB to DOCX using Python with custom settings
2
3import os
4import aspose.html.converters as conv
5import aspose.html.saving as sav
6import aspose.html.drawing as dr
7
8# Setup directories and define paths
9output_dir = "output/"
10input_dir = "data/"
11os.makedirs(output_dir, exist_ok=True)
12
13document_path = os.path.join(input_dir, "input.epub")
14save_path = os.path.join(output_dir, "epub-to-docx.docx")
15
16# Open an existing EPUB file for reading
17with open(document_path, "rb") as stream:
18
19 # Create an instance of DocSaveOptions
20 options = sav.DocSaveOptions()
21 options.page_setup.any_page = dr.Page(dr.Size(800, 600), dr.Margin(10, 10, 10, 10))
22 options.font_embedding_rule.FULL
23 options.document_format.DOCX
24 options.css.media_type.SCREEN
25
26 # Convert EPUB to DOCX
27 conv.Converter.convert_epub(stream, options, save_path)在示例中,我们从指定路径的文件系统中打开并读取源文件。DocSaveOptions()构造函数初始化了一个 DocSaveOptions 类实例,并将其传递给 convert_epub()方法,该方法接收stream、options、输出文件路径save_path并执行转换操作。DocSaveOptions 类提供了大量属性,可让你完全控制各种参数,并改进 EPUB 到 DOCX 格式的转换过程。在本示例中,我们使用了 page_setup、document_format、font_embedding_rule 和 css.media_type 属性。
注意: 您需要在本地文件系统中指定源文件和输出文件的路径(document_path 和 save_path)。
保存选项 – DocSaveOptions 类
Aspose.HTML for Python via .NET 允许使用默认或自定义保存选项将 EPUB 转换为 DOCX。使用 DocSaveOptions 可以调整渲染过程。该类的某些属性继承了基类的属性,如 DocRenderingOptions 或 RenderingOptions。DocSaveOptions “被配置为以 DOCX 格式保存文档,它包括以下属性:
- page_setup – 通过该属性,您可以定义页面的布局,包括页面大小、页边距和其他布局方面,确保输出文档与所需格式相匹配。
- horizontal_resolution – 该属性设置或获取内部图像的水平分辨率,单位为每英寸像素。默认为 300 dpi。分辨率越高,渲染质量越好,但文件大小也越大。使用该属性可以控制质量和文件大小之间的权衡。
- vertical_resolution – 该属性设置或获取内部图像的垂直分辨率,单位为每英寸像素。默认为 300 dpi。与 “horizontal_resolution “类似,该属性控制文档的垂直分辨率,从而影响文档的清晰度和整体大小。
- background_color – 使用此属性可以设置渲染输出的背景颜色。如果未设置,默认背景色为透明色。
- css – 该属性获取一个 CssOptions 对象,用于配置 CSS 属性处理。例如,“css.media_type “属性为不同的媒体类型指定了不同的样式,确保根据文档的呈现方式应用正确的 CSS 规则。
- font_embedding_rule – 该属性设置嵌入字体的规则,并控制是否以及如何在输出文档中嵌入字体。默认值为
NONE。 - document_format – 该属性设置输出文档的文件格式。默认为 DOCX。
下载 Aspose.HTML for Python via .NET 库,即可成功、快速、轻松地将 HTML、MHTML、EPUB、SVG 和 Markdown 文档转换为最流行的格式。
Aspose.HTML提供免费在线 EPUB到DOCX转换器,可将EPUB转换为高质量、简单快捷的DOCX。只需上传、转换文件并在几秒钟内获得结果!
