Extraire des pages PDF en Python

Extraire une seule page d’un PDF

Extrayez une page spécifique d’un document PDF et enregistrez‑la dans un nouveau fichier. En utilisant la bibliothèque Aspose.PDF, le script copie la page souhaitée dans un nouveau PDF, laissant le document original inchangé. Cela est utile pour diviser les PDF ou isoler des pages importantes à distribuer.

Chargez le PDF source en utilisant le Document API (ap.Document()).
Créez un nouveau Document pour contenir la page extraite.
Ajoutez le souhaité Page du document source vers le nouveau PDF en utilisant le document de destination PageCollection (dst_document.pages.add(...)).
- Dans cet exemple, la page 2 est extraite (indexation à partir de 1).
Enregistrez le nouveau Document avec la page extraite vers le fichier de sortie spécifié.

import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

Extraire plusieurs pages d’un PDF

Extrayez plusieurs pages spécifiques d’un document PDF et enregistrez-les dans un nouveau fichier. En utilisant la bibliothèque Aspose.PDF, les pages sélectionnées sont copiées dans un nouveau PDF tout en laissant le document original intact. Cela est utile pour créer des PDF plus petits contenant uniquement les sections pertinentes d’un document plus volumineux.

Chargez le PDF source en utilisant le Document API (ap.Document()).
Créez un nouveau Document pour contenir les pages extraites.
Sélectionnez les pages à extraire (dans cet exemple, les pages 2 et 3 en utilisant une indexation à partir de 1).
Ajoutez chaque sélectionné Page du document source au nouveau PDF en utilisant son PageCollection.
Enregistrez le nouveau Document avec les pages extraites vers le fichier de sortie spécifié.

import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

Sujets de page associés

Recadrer des pages PDF en Python Obtenir et définir les propriétés des pages PDF en Python