将 PDF 转换为 HTML 在 Python 中
Contents
[
Hide
]
概述
本文解释了如何使用 Python 将 PDF 转换为 HTML。它涵盖了这些主题。
格式:HTML
将 PDF 转换为 HTML
Aspose.PDF for Python via .NET 提供了许多功能,用于将各种文件格式转换为 PDF 文档,并将 PDF 文件转换为各种输出格式。 这篇文章讨论了如何将PDF文件转换为HTML。你可以使用几行Python代码将PDF转换为HTML。如果你想创建一个网站或将内容添加到在线论坛,可能需要将PDF转换为HTML。将PDF转换为HTML的一种方法是使用Python编程。
- 创建一个Document对象的实例,并使用源PDF文档。
- 通过调用 save() 方法,将其保存为 HtmlSaveOptions。
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
# 打开 PDF 文档
document = ap.Document(input_pdf)
# 以 HTML 格式保存文档
save_options = ap.HtmlSaveOptions()
document.save(output_pdf, save_options)
另请参见
本文还涵盖了以下主题。代码与上述相同。
格式: HTML