将 PDF 转换为 HTML 在 Python 中

概述

本文解释了如何使用 Python 将 PDF 转换为 HTML。它涵盖了这些主题。

格式HTML

将 PDF 转换为 HTML

Aspose.PDF for Python via .NET 提供了许多功能,用于将各种文件格式转换为 PDF 文档,并将 PDF 文件转换为各种输出格式。 这篇文章讨论了如何将PDF文件转换为HTML。你可以使用几行Python代码将PDF转换为HTML。如果你想创建一个网站或将内容添加到在线论坛,可能需要将PDF转换为HTML。将PDF转换为HTML的一种方法是使用Python编程。

步骤:在Python中将PDF转换为HTML

  1. 创建一个Document对象的实例,并使用源PDF文档。
  2. 通过调用 save() 方法,将其保存为 HtmlSaveOptions

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
    # 打开 PDF 文档
    document = ap.Document(input_pdf)

    # 以 HTML 格式保存文档
    save_options = ap.HtmlSaveOptions()
    document.save(output_pdf, save_options)

另请参见

本文还涵盖了以下主题。代码与上述相同。

格式: HTML