Extraer páginas PDF en Python

Extraer una sola página de un PDF

Extrae una página específica de un documento PDF y guárdala como un archivo nuevo. Usando la biblioteca Aspose.PDF, el script copia la página deseada a un nuevo PDF, dejando el documento original sin cambios. Esto es útil para dividir PDFs o aislar páginas importantes para su distribución.

Cargue el PDF de origen usando el Document API (ap.Document()).
Crear un nuevo Document para contener la página extraída.
Añada el deseado Page del documento de origen al nuevo PDF usando el documento de destino PageCollection (dst_document.pages.add(...)).
- En este ejemplo, la página 2 se extrae (indexación basada en 1).
Guarda el nuevo Document con la página extraída al archivo de salida especificado.

import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

Extraer varias páginas de un PDF

Extraiga varias páginas específicas de un documento PDF y guárdelas en un nuevo archivo. Con la biblioteca Aspose.PDF, las páginas seleccionadas se copian a un nuevo PDF mientras se mantiene intacto el documento original. Esto es útil para crear PDFs más pequeños que contengan solo las secciones relevantes de un documento más grande.

Cargue el PDF de origen usando el Document API (ap.Document()).
Crear un nuevo Document para contener las páginas extraídas.
Seleccione las páginas a extraer (en este ejemplo, páginas 2 y 3 usando indexación basada en 1).
Agregue cada seleccionado Page del documento fuente al nuevo PDF usando su PageCollection.
Guarda el nuevo Document con las páginas extraídas al archivo de salida especificado.

import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

Temas de página relacionados

Recortar páginas PDF en Python Obtener y establecer propiedades de página PDF en Python