Извлечение страниц из PDF

Contents
[ ]

Извлечение страниц из PDF полезно, когда необходимо создать подмножество документа, поделиться только определённым содержимым или реорганизовать PDF‑файлы для презентаций, отчетов или печати. С помощью Aspose.PDF for Python разработчики могут программно извлекать страницы из PDF‑файла и сохранять их как новый документ.

Узнайте, как использовать метод extract в PdfFileEditor классе. Указывая список страниц для извлечения, вы можете создать новый PDF, содержащий только выбранные страницы, при этом сохраняется оригинальное содержание и форматирование.

  1. Создайте объект PdfFileEditor.
  2. Определите страницы для извлечения.
  3. Извлеките страницы.
import aspose.pdf as ap
import aspose.pdf.facades as pdf_facades

import sys
from os import path

sys.path.append(path.join(path.dirname(__file__), ".."))
from config import set_license, initialize_data_dir


# Extract Pages from PDF
def extract_pages_from_pdf(infile, outfile):
    # Create a PdfFileEditor object
    pdf_editor = pdf_facades.PdfFileEditor()

    # Define the page numbers to be extracted (1-based index)
    pages_to_extract = [1, 4, 3]

    # Extract the specified pages from the PDF document and save to a new PDF document
    pdf_editor.extract(infile, pages_to_extract, outfile)