Извлечение страниц PDF в Python

Извлечение отдельной страницы из PDF

Извлеките определённую страницу из PDF‑документа и сохраните её как новый файл. С помощью библиотеки Aspose.PDF скрипт копирует нужную страницу в новый PDF, оставляя оригинальный документ неизменным. Это полезно для разделения PDF‑файлов или выделения важных страниц для распространения.

  1. Загрузите исходный PDF с помощью Document API (ap.Document()).
  2. Создайте новый Document чтобы удержать извлечённую страницу.
  3. Добавьте нужную Page из исходного документа в новый PDF, используя документ назначения PageCollection (dst_document.pages.add(...)).
    • В этом примере страница 2 извлекается (нумерация с 1).
  4. Сохраните новый Document с извлечённой страницей в указанный файл вывода.
import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

Извлечение нескольких страниц из PDF

Извлеките несколько конкретных страниц из PDF‑документа и сохраните их в новый файл. С помощью библиотеки Aspose.PDF выбранные страницы копируются в новый PDF, при этом исходный документ остаётся неизменным. Это полезно для создания более небольших PDF, содержащих только релевантные разделы большого документа.

  1. Загрузите исходный PDF с помощью Document API (ap.Document()).
  2. Создайте новый Document для хранения извлечённых страниц.
  3. Выберите страницы для извлечения (в этом примере страницы 2 и 3, используя индексацию с 1).
  4. Добавьте каждую выбранную Page из исходного документа в новый PDF, используя его PageCollection.
  5. Сохраните новый Document с извлечёнными страницами в указанный файл вывода.
import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

Связанные темы страницы