Convert PDF to HTML in Python

Overview

Эта статья объясняет, как конвертировать PDF в HTML с использованием Python. Она охватывает следующие темы.

Формат: HTML

Convert PDF to HTML

Aspose.PDF for Python via .NET предоставляет множество функций для конвертации различных форматов файлов в документы PDF и конвертации PDF-файлов в различные выходные форматы. Этот документ обсуждает, как преобразовать PDF файл в HTML. Вы можете использовать всего несколько строк кода на Python для преобразования PDF в HTML. Вам может понадобиться преобразовать PDF в HTML, если вы хотите создать веб-сайт или добавить контент на онлайн-форум. Один из способов преобразования PDF в HTML - программно использовать Python.

Шаги: Преобразование PDF в HTML на Python

  1. Создайте экземпляр объекта Document с исходным PDF-документом.
  2. Сохраните его в HtmlSaveOptions с помощью вызова метода save().

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
    # Открыть документ PDF
    document = ap.Document(input_pdf)

    # сохранить документ в формате HTML
    save_options = ap.HtmlSaveOptions()
    document.save(output_pdf, save_options)

См. также

Эта статья также охватывает следующие темы. Код такой же, как и выше.

Формат: HTML