Extraer páginas PDF en Python
Contents
[
Hide
]
Extraer una sola página de un PDF
Extrae una página específica de un documento PDF y guárdala como un archivo nuevo. Usando la biblioteca Aspose.PDF, el script copia la página deseada a un nuevo PDF, dejando el documento original sin cambios. Esto es útil para dividir PDFs o aislar páginas importantes para su distribución.
- Cargue el PDF de origen usando el
DocumentAPI (ap.Document()). - Crear un nuevo
Documentpara contener la página extraída. - Añada el deseado
Pagedel documento de origen al nuevo PDF usando el documento de destinoPageCollection(dst_document.pages.add(...)).- En este ejemplo, la página 2 se extrae (indexación basada en 1).
- Guarda el nuevo
Documentcon la página extraída al archivo de salida especificado.
import aspose.pdf as ap
def extract_page(input_file_name: str, output_file_name: str) -> None:
src_document = ap.Document(input_file_name)
dst_document = ap.Document()
dst_document.pages.add(src_document.pages[2])
dst_document.save(output_file_name)
Extraer varias páginas de un PDF
Extraiga varias páginas específicas de un documento PDF y guárdelas en un nuevo archivo. Con la biblioteca Aspose.PDF, las páginas seleccionadas se copian a un nuevo PDF mientras se mantiene intacto el documento original. Esto es útil para crear PDFs más pequeños que contengan solo las secciones relevantes de un documento más grande.
- Cargue el PDF de origen usando el
DocumentAPI (ap.Document()). - Crear un nuevo
Documentpara contener las páginas extraídas. - Seleccione las páginas a extraer (en este ejemplo, páginas 2 y 3 usando indexación basada en 1).
- Agregue cada seleccionado
Pagedel documento fuente al nuevo PDF usando suPageCollection. - Guarda el nuevo
Documentcon las páginas extraídas al archivo de salida especificado.
import aspose.pdf as ap
def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
document = ap.Document(input_file_name)
pages = [2, 3]
another_document = ap.Document()
for page_index in pages:
another_document.pages.add(document.pages[page_index])
another_document.save(output_file_name)