Ekstrak Halaman PDF dengan Python

Ekstrak Halaman Tunggal dari PDF

Ekstrak halaman tertentu dari dokumen PDF dan simpan sebagai file baru. Menggunakan pustaka Aspose.PDF, skrip menyalin halaman yang diinginkan ke PDF baru, meninggalkan dokumen asli tidak berubah. Ini berguna untuk membagi PDF atau mengisolasi halaman penting untuk didistribusikan.

  1. Muat PDF sumber menggunakan the Document API (ap.Document()).
  2. Buat yang baru Document untuk menampung halaman yang diekstrak.
  3. Tambahkan yang diinginkan Page dari dokumen sumber ke PDF baru menggunakan dokumen tujuan’s PageCollection (dst_document.pages.add(...)).
    • Dalam contoh ini, halaman 2 diekstrak (pengindeksan berbasis 1).
  4. Simpan yang baru Document dengan halaman yang diekstrak ke file output yang ditentukan.
import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

Ekstrak Beberapa Halaman dari PDF

Ekstrak beberapa halaman spesifik dari dokumen PDF dan simpan ke dalam file baru. Dengan menggunakan pustaka Aspose.PDF, halaman yang dipilih disalin ke PDF baru sementara dokumen asli tetap tidak berubah. Ini berguna untuk membuat PDF yang lebih kecil yang hanya berisi bagian relevan dari dokumen yang lebih besar.

  1. Muat PDF sumber menggunakan the Document API (ap.Document()).
  2. Buat yang baru Document untuk menampung halaman yang diekstrak.
  3. Pilih halaman yang akan diekstrak (dalam contoh ini, halaman 2 dan 3 menggunakan indeks berbasis 1).
  4. Tambahkan setiap yang dipilih Page dari dokumen sumber ke PDF baru menggunakan PageCollection.
  5. Simpan yang baru Document dengan halaman yang diekstrak ke file output yang ditentukan.
import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

Topik Halaman Terkait