将 PDF 转换为 HTML 在 Python 中

概述

本文解释了如何使用 Python 将 PDF 转换为 HTML。它涵盖了以下主题。

格式: HTML

将 PDF 转换为 HTML

Aspose.PDF for Python via .NET 提供了许多功能，可以将各种文件格式转换为 PDF 文档，并将 PDF 文件转换为各种输出格式。这篇文章讨论了如何将PDF文件转换为HTML。你可以只用几行Python代码将PDF转换为HTML。如果你想创建一个网站或将内容添加到在线论坛，你可能需要将PDF转换为HTML。将PDF转换为HTML的一种方法是通过Python编程实现。

尝试在线将PDF转换为HTML

Aspose.PDF for Python为你提供了在线免费应用程序“PDF to HTML”，你可以尝试调查其功能和工作质量。

步骤：在Python中将PDF转换为HTML

使用源PDF文档创建一个Document对象的实例。
通过调用 Document.save() 方法保存为 HtmlSaveOptions。

from asposepdf import Api

documentName = "../../testdata/source.pdf"
documentOutName = "../../testout/result.html"
# 打开 PDF 文档
document = Api.Document(documentName)

# 以 HTML 格式保存文档
save_options = Api.HtmlSaveOptions()
document.save(documentOutName, save_options)

另请参见

本文还涵盖以下主题。代码与上面相同。

格式：HTML

将HTML转换为PDF在Python中将PDF转换为不同的图像格式在Python中