Ekstrak Halaman PDF dengan Python
Contents
[
Hide
]
Ekstrak Halaman Tunggal dari PDF
Ekstrak halaman tertentu dari dokumen PDF dan simpan sebagai file baru. Menggunakan pustaka Aspose.PDF, skrip menyalin halaman yang diinginkan ke PDF baru, meninggalkan dokumen asli tidak berubah. Ini berguna untuk membagi PDF atau mengisolasi halaman penting untuk didistribusikan.
- Muat PDF sumber menggunakan the
DocumentAPI (ap.Document()). - Buat yang baru
Documentuntuk menampung halaman yang diekstrak. - Tambahkan yang diinginkan
Pagedari dokumen sumber ke PDF baru menggunakan dokumen tujuan’sPageCollection(dst_document.pages.add(...)).- Dalam contoh ini, halaman 2 diekstrak (pengindeksan berbasis 1).
- Simpan yang baru
Documentdengan halaman yang diekstrak ke file output yang ditentukan.
import aspose.pdf as ap
def extract_page(input_file_name: str, output_file_name: str) -> None:
src_document = ap.Document(input_file_name)
dst_document = ap.Document()
dst_document.pages.add(src_document.pages[2])
dst_document.save(output_file_name)
Ekstrak Beberapa Halaman dari PDF
Ekstrak beberapa halaman spesifik dari dokumen PDF dan simpan ke dalam file baru. Dengan menggunakan pustaka Aspose.PDF, halaman yang dipilih disalin ke PDF baru sementara dokumen asli tetap tidak berubah. Ini berguna untuk membuat PDF yang lebih kecil yang hanya berisi bagian relevan dari dokumen yang lebih besar.
- Muat PDF sumber menggunakan the
DocumentAPI (ap.Document()). - Buat yang baru
Documentuntuk menampung halaman yang diekstrak. - Pilih halaman yang akan diekstrak (dalam contoh ini, halaman 2 dan 3 menggunakan indeks berbasis 1).
- Tambahkan setiap yang dipilih
Pagedari dokumen sumber ke PDF baru menggunakanPageCollection. - Simpan yang baru
Documentdengan halaman yang diekstrak ke file output yang ditentukan.
import aspose.pdf as ap
def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
document = ap.Document(input_file_name)
pages = [2, 3]
another_document = ap.Document()
for page_index in pages:
another_document.pages.add(document.pages[page_index])
another_document.save(output_file_name)