Извлечение страниц PDF в Python
Contents
[
Hide
]
Извлечение отдельной страницы из PDF
Извлеките определённую страницу из PDF‑документа и сохраните её как новый файл. С помощью библиотеки Aspose.PDF скрипт копирует нужную страницу в новый PDF, оставляя оригинальный документ неизменным. Это полезно для разделения PDF‑файлов или выделения важных страниц для распространения.
- Загрузите исходный PDF с помощью
DocumentAPI (ap.Document()). - Создайте новый
Documentчтобы удержать извлечённую страницу. - Добавьте нужную
Pageиз исходного документа в новый PDF, используя документ назначенияPageCollection(dst_document.pages.add(...)).- В этом примере страница 2 извлекается (нумерация с 1).
- Сохраните новый
Documentс извлечённой страницей в указанный файл вывода.
import aspose.pdf as ap
def extract_page(input_file_name: str, output_file_name: str) -> None:
src_document = ap.Document(input_file_name)
dst_document = ap.Document()
dst_document.pages.add(src_document.pages[2])
dst_document.save(output_file_name)
Извлечение нескольких страниц из PDF
Извлеките несколько конкретных страниц из PDF‑документа и сохраните их в новый файл. С помощью библиотеки Aspose.PDF выбранные страницы копируются в новый PDF, при этом исходный документ остаётся неизменным. Это полезно для создания более небольших PDF, содержащих только релевантные разделы большого документа.
- Загрузите исходный PDF с помощью
DocumentAPI (ap.Document()). - Создайте новый
Documentдля хранения извлечённых страниц. - Выберите страницы для извлечения (в этом примере страницы 2 и 3, используя индексацию с 1).
- Добавьте каждую выбранную
Pageиз исходного документа в новый PDF, используя егоPageCollection. - Сохраните новый
Documentс извлечёнными страницами в указанный файл вывода.
import aspose.pdf as ap
def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
document = ap.Document(input_file_name)
pages = [2, 3]
another_document = ap.Document()
for page_index in pages:
another_document.pages.add(document.pages[page_index])
another_document.save(output_file_name)