PythonでPDFをHTMLに変換

概要

この記事では、Pythonを使用してPDFをHTMLに変換する方法を説明します。次のトピックをカバーします。

形式: HTML

PDFをHTMLに変換

Aspose.PDF for Python via .NETは、さまざまなファイル形式をPDFドキュメントに変換し、PDFファイルをさまざまな出力形式に変換するための多くの機能を提供します。 この記事では、PDFファイルをHTMLに変換する方法について説明します。PDFをHTMLに変換するために、Pythonのコードを数行だけ使用することができます。ウェブサイトを作成したり、オンラインフォーラムにコンテンツを追加したりする場合に、PDFをHTMLに変換する必要があるかもしれません。PDFをHTMLに変換する一つの方法は、Pythonをプログラム的に使用することです。

手順: PythonでPDFをHTMLに変換する

  1. ソースPDFドキュメントを使用してDocumentオブジェクトのインスタンスを作成します。
  2. save() メソッドを呼び出して HtmlSaveOptions に保存します。

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
    # PDFドキュメントを開く
    document = ap.Document(input_pdf)

    # ドキュメントをHTML形式で保存
    save_options = ap.HtmlSaveOptions()
    document.save(output_pdf, save_options)

関連情報

この記事は以下のトピックもカバーしています。コードは上記と同じです。

フォーマット: HTML