PDF からページを抽出

Contents
[ ]

PDF からのページの抽出は、文書のサブセットを作成したり、特定のコンテンツのみを共有したり、プレゼンテーション、レポート、印刷用に PDF を再編成したりする必要がある場合に便利です。Aspose.PDF for Python を使用すると、開発者はプログラムで PDF ファイルからページを抽出し、新しい文書として保存できます。

の抽出法の使い方を学びましょう PDF ファイルエディター クラス。抽出するページのリストを指定すると、元のコンテンツと書式を維持したまま、選択したページのみを含む新しい PDF を生成できます。

  1. PDF ファイルエディターオブジェクトを作成します。
  2. 抽出するページを定義します。
  3. ページを抽出します。
import aspose.pdf as ap
import aspose.pdf.facades as pdf_facades

import sys
from os import path

sys.path.append(path.join(path.dirname(__file__), ".."))
from config import set_license, initialize_data_dir


# Extract Pages from PDF
def extract_pages_from_pdf(infile, outfile):
    # Create a PdfFileEditor object
    pdf_editor = pdf_facades.PdfFileEditor()

    # Define the page numbers to be extracted (1-based index)
    pages_to_extract = [1, 4, 3]

    # Extract the specified pages from the PDF document and save to a new PDF document
    pdf_editor.extract(infile, pages_to_extract, outfile)