PythonでPDFをHTMLに変換
Contents
[
Hide
]
概要
この記事では、Pythonを使用してPDFをHTMLに変換する方法を説明します。次のトピックをカバーします。
形式: HTML
PDFをHTMLに変換
Aspose.PDF for Python via .NETは、さまざまなファイル形式をPDFドキュメントに変換し、PDFファイルをさまざまな出力形式に変換するための多くの機能を提供します。 この記事では、PDFファイルをHTMLに変換する方法について説明します。PDFをHTMLに変換するために、Pythonのコードを数行だけ使用することができます。ウェブサイトを作成したり、オンラインフォーラムにコンテンツを追加したりする場合に、PDFをHTMLに変換する必要があるかもしれません。PDFをHTMLに変換する一つの方法は、Pythonをプログラム的に使用することです。
オンラインでPDFをHTMLに変換してみる
Aspose.PDF for Pythonは、無料のオンラインアプリケーション“PDF to HTML”を提供しており、その機能と品質を調査することができます。
- ソースPDFドキュメントを使用してDocumentオブジェクトのインスタンスを作成します。
- save() メソッドを呼び出して HtmlSaveOptions に保存します。
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_html.html"
# PDFドキュメントを開く
document = ap.Document(input_pdf)
# ドキュメントをHTML形式で保存
save_options = ap.HtmlSaveOptions()
document.save(output_pdf, save_options)
関連情報
この記事は以下のトピックもカバーしています。コードは上記と同じです。
フォーマット: HTML