微调转换器 – 用 Python 转换 HTML
在 Python 中转换 HTML 的几种方法
您可以用 Python 在线或编程将 HTML 转换成各种流行格式。使用 Converter 类的
convert_html() 方法、HTMLDocument 类的
render_to() 方法或
Renderer 类的 render() 方法可以将 HTML 转换为其他格式。
为什么要使用微调转换器?
在 “微调转换器 “一章中,Aspose.HTML for Python via .NET 提供了渲染基于 HTML 文档的替代方法,使您可以更好地控制 Python 应用程序中的渲染过程。我们的 Python 库实现了一组渲染设备:PdfDevice、XpsDevice、DocDevice 和 ImageDevice。每个设备都有自己独特的选项,分别通过 PdfRenderingOptions、XpsRenderingOptions、DocRenderingOptions 和 ImageRenderingOptions 类实现。例如,你可以修改页面大小,调整页边距和颜色,通过改变图像质量和分辨率来减小文件大小,以及为 PDF 文档设置安全密码。
本节介绍了通过使用 HTMLDocument 类的 render_to() 方法和 Renderer 类的 render() 方法将基于 HTML 的文件转换为其他流行格式的支持场景:
- 渲染设备 – 本文将概述渲染设备,包括 PdfDevice、XpsDevice、DocDevice 和 ImageDevice。方法
render_to()和render()接受这些呈现设备的实例作为参数,允许你将 HTML 转换为 PDF、XPS、DOCX 和图像格式。 - 渲染选项 – 您可以使用各种渲染选项自定义转换过程,如页面大小、页边距、图像质量、方向、背景颜色等。这些选项将作为参数传递给渲染设备,帮助您实现所需的文档输出。
- 渲染器 – 本文讨论支持的渲染器:HtmlRenderer、SvgRenderer、MhtmlRenderer 和 EpubRenderer。每种渲染器都是专门为转换 HTML、SVG、MHTML 和 EPUB 文档而设计的。
使用 Python 将 HTML 渲染成 PDF
本示例演示了如何使用 Aspose.HTML for Python 通过 .NET 轻松地将在线 HTML 页面转换为 PDF 文档。只需几行代码,您就可以从 URL 加载 HTML 文档,并使用默认渲染选项将其直接渲染为 PDF 文件。
1import aspose.html as ah
2import aspose.html.rendering.pdf as rp
3
4doc = ah.HTMLDocument("https://docs.aspose.com/html/files/document.html")
5doc.render_to(rp.PdfDevice("output/document.pdf"))什么是 Aspose.HTML 中的渲染设备?
Aspose.HTML for Python via .NET 中的渲染设备表示二维绘图表面,通过 IDevice 接口实现。它负责将 HTML 内容转换成各种输出格式。
Aspose.HTML for Python via .NET 提供以下渲染设备:
- PdfDevice – 将 HTML 渲染为 PDF。支持将 MHTML、SVG 和 EPUB 渲染为 PDF。
- XpsDevice – 将 HTML 渲染成 XPS。支持将 MHTML、SVG 和 EPUB 渲染为 XPS。
- DocDevice – 将 HTML 呈现为 DOCX。支持将 MHTML、SVG 和 EPUB 呈现为 DOCX。
- ImageDevice – 将 HTML 呈现为图像格式。支持将 MHTML、SVG 和 EPUB 呈现为图像。
每个设备都有自己的渲染选项,可通过 PdfRenderingOptions、 XpsRenderingOptions、 DocRenderingOptions 和 ImageRenderingOptions 等类获得。通过这些选项,你可以控制输出质量、布局和其他设置。
您可以从 GitHub 下载完整的示例和数据文件。
Aspose.HTML 提供免费的 Converters – 用于将 HTML、XHTML、MHTML、EPUB、XML 或 Markdown 文档转换为 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF、GIF、Markdown 和其他格式的在线工具集合。这些转换器兼容任何操作系统,无需额外安装软件。它们是有效转换 HTML 和基于 HTML 文档的快速简便方法。
