Python で PDF ページを抽出

PDF から 1 ページを抽出

PDF ドキュメントから特定のページを抽出し、新しいファイルとして保存します。Aspose.PDF ライブラリを使用して、スクリプトは元の文書を変更せずに目的のページを新しい PDF にコピーします。PDF を分割したり、重要なページを分離して配布したりする場合に便利です。

  1. を使用してソース PDF をロードします。 Document アピ (ap.Document()).
  2. 新規作成 Document 抽出されたページを保持します。
  3. 必要なものを追加 Page ソース文書から宛先文書を使用して新規 PDF へ PageCollection (dst_document.pages.add(...)). -この例では、ページ 2 が抽出されます (1 ベースのインデックス)。
  4. 新しいものを保存 Document 抽出されたページを指定された出力ファイルに保存します。
import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

PDF から複数のページを抽出

PDF ドキュメントから複数の特定のページを抽出し、新しいファイルに保存します。Aspose.PDF ライブラリを使用すると、選択したページは元の文書はそのままの状態で新しい PDF にコピーされます。これは、大きな文書の関連部分だけを含む小さな PDF を作成する場合に便利です。

  1. を使用してソース PDF をロードします。 Document アピ (ap.Document()).
  2. 新規作成 Document 抽出されたページを保存します。
  3. 抽出するページを選択します (この例では、2 ページ目と 3 ページ目に 1 ベースのインデックスを使用しています)。
  4. 選択した各項目を追加 Page ソース文書から、その PDF を使用して新しい PDF へ PageCollection.
  5. 新しいものを保存 Document 抽出されたページを指定された出力ファイルに保存します。
import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

関連ページトピック