Python で PDF ページを抽出
Contents
[
Hide
]
PDF から 1 ページを抽出
PDF ドキュメントから特定のページを抽出し、新しいファイルとして保存します。Aspose.PDF ライブラリを使用して、スクリプトは元の文書を変更せずに目的のページを新しい PDF にコピーします。PDF を分割したり、重要なページを分離して配布したりする場合に便利です。
- を使用してソース PDF をロードします。
Documentアピ (ap.Document()). - 新規作成
Document抽出されたページを保持します。 - 必要なものを追加
Pageソース文書から宛先文書を使用して新規 PDF へPageCollection(dst_document.pages.add(...)). -この例では、ページ 2 が抽出されます (1 ベースのインデックス)。 - 新しいものを保存
Document抽出されたページを指定された出力ファイルに保存します。
import aspose.pdf as ap
def extract_page(input_file_name: str, output_file_name: str) -> None:
src_document = ap.Document(input_file_name)
dst_document = ap.Document()
dst_document.pages.add(src_document.pages[2])
dst_document.save(output_file_name)
PDF から複数のページを抽出
PDF ドキュメントから複数の特定のページを抽出し、新しいファイルに保存します。Aspose.PDF ライブラリを使用すると、選択したページは元の文書はそのままの状態で新しい PDF にコピーされます。これは、大きな文書の関連部分だけを含む小さな PDF を作成する場合に便利です。
- を使用してソース PDF をロードします。
Documentアピ (ap.Document()). - 新規作成
Document抽出されたページを保存します。 - 抽出するページを選択します (この例では、2 ページ目と 3 ページ目に 1 ベースのインデックスを使用しています)。
- 選択した各項目を追加
Pageソース文書から、その PDF を使用して新しい PDF へPageCollection. - 新しいものを保存
Document抽出されたページを指定された出力ファイルに保存します。
import aspose.pdf as ap
def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
document = ap.Document(input_file_name)
pages = [2, 3]
another_document = ap.Document()
for page_index in pages:
another_document.pages.add(document.pages[page_index])
another_document.save(output_file_name)