PDFをEPUB、LaTeX、Text、XPSに変換する方法(Python)

PDFをEPUBに変換

**EPUB**は、国際デジタル出版フォーラム(IDPF)による無料のオープンな電子書籍標準です。 ファイルには拡張子 .epub が付いています。
EPUB はリフロー可能なコンテンツ用に設計されており、EPUB リーダーは特定の表示デバイスに最適化されたテキストを表示できます。EPUB は固定レイアウトのコンテンツもサポートしています。この形式は、出版社や変換ハウスが社内で使用するため、および配布や販売のための単一の形式として意図されています。これは Open eBook 標準の後継です。

Aspose.PDF for Python も PDF ドキュメントを EPUB 形式に変換する機能をサポートしています。Aspose.PDF for Python には ‘EpubSaveOptions’ という名前のクラスがあり、EPUB ファイルを生成するために Document.Save() メソッドの第二引数として使用できます。
以下のコードスニペットを使用して、この要件を Python で達成してみてください。


from asposepdf import Api

# ライセンスを初期化
documentName = "testdata/license/Aspose.PDF.PythonviaJava.lic"
licenseObject = Api.License()
licenseObject.setLicense(documentName)

# Epub に変換
documentName = "testdata/Hello.pdf"
doc = Api.Document(documentName, None)
documentOutName = "testout/out.epub"
doc.save(documentOutName, Api.SaveFormat.Epub)

PDFをLaTeX/TeXに変換

Aspose.PDF for Python via Javaは、PDFをLaTeX/TeXに変換することをサポートしています。LaTeXファイル形式は特別なマークアップのあるテキストファイル形式で、高品質な組版のためのTeXベースのドキュメント準備システムで使用されます。

PDFファイルをTeXに変換するには、Aspose.PDFはLaTeXSaveOptionsクラスを提供しており、変換プロセス中に一時的な画像を保存するためのOutDirectoryPathプロパティを提供しています。

以下のコードスニペットは、PDFファイルをPythonでTEX形式に変換するプロセスを示しています。

from asposepdf import Api

documentName = "testdata/Hello.pdf"
doc = Api.Document(documentName, None)
documentOutName = "testout/out.tex"
doc.save(documentOutName, Api.SaveFormat.TeX)

PDFをテキストに変換

Aspose.PDF for Pythonは、PDFドキュメント全体および単一ページをテキストファイルに変換することをサポートしています。

PDFドキュメントをテキストファイルに変換

‘TextDevice’クラスを使用してPDFドキュメントをTXTファイルに変換できます。

以下のコードスニペットは、すべてのページからテキストを抽出する方法を説明しています。


from asposepdf import Api, Device

DIR_INPUT = "testdata/"
DIR_OUTPUT = "testout/"

input_pdf = DIR_INPUT + "source.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_text"
# PDFドキュメントを開く
document = Api.Document(input_pdf)

device = Device.TextDevice()

for i in range(0, document.getPages.size):
    imageFileName = output_pdf + "_page_" + str(i + 1) + "_out.txt"
    # 特定のページを変換し、テキストファイルとして保存
    device.process(document.getPages.getPage(i + 1), imageFileName)

PDFをXPSに変換

Aspose.PDF for Python は、PDFファイルをXPS形式に変換する機能を提供します。PythonでPDFファイルをXPS形式に変換するために、提示されたコードスニペットを試してみましょう。

XPSファイルタイプは、主にMicrosoft CorporationによるXML Paper Specificationに関連付けられています。XML Paper Specification(XPS)は、以前はMetroというコードネームで、Next Generation Print Path(NGPP)マーケティングコンセプトを包含しており、Windowsオペレーティングシステムに文書の作成と表示を統合するためのMicrosoftの取り組みです。

PDFファイルをXPSに変換するには、Aspose.PDFにはXpsSaveOptionsクラスがあり、これはXPSファイルを生成するためにDocument.Save()メソッドの2番目の引数として使用されます。

次のコードスニペットは、PDFファイルをXPS形式に変換するプロセスを示しています。


from asposepdf import Api

documentName = "../../testdata/Hello.pdf"
doc = Api.Document(documentName, None)
documentOutName = "../../testout/out.xps"
doc.save(documentOutName, Api.SaveFormat.Xps)