将 PDF 转换为 HTML 在 Python 中

概述

本文解释了如何使用 Python 将 PDF 转换为 HTML。它涵盖了以下主题。

格式: HTML

将 PDF 转换为 HTML

Aspose.PDF for Python via .NET 提供了许多功能,可以将各种文件格式转换为 PDF 文档,并将 PDF 文件转换为各种输出格式。 这篇文章讨论了如何将PDF文件转换为HTML。你可以只用几行Python代码将PDF转换为HTML。如果你想创建一个网站或将内容添加到在线论坛,你可能需要将PDF转换为HTML。将PDF转换为HTML的一种方法是通过Python编程实现。

步骤:在Python中将PDF转换为HTML

  1. 使用源PDF文档创建一个Document对象的实例。
  2. 通过调用 Document.save() 方法保存为 HtmlSaveOptions
from asposepdf import Api

documentName = "../../testdata/source.pdf"
documentOutName = "../../testout/result.html"
# 打开 PDF 文档
document = Api.Document(documentName)

# 以 HTML 格式保存文档
save_options = Api.HtmlSaveOptions()
document.save(documentOutName, save_options)

另请参见

本文还涵盖以下主题。代码与上面相同。

格式HTML