Extraire des pages PDF en Python
Contents
[
Hide
]
Extraire une seule page d’un PDF
Extrayez une page spécifique d’un document PDF et enregistrez‑la dans un nouveau fichier. En utilisant la bibliothèque Aspose.PDF, le script copie la page souhaitée dans un nouveau PDF, laissant le document original inchangé. Cela est utile pour diviser les PDF ou isoler des pages importantes à distribuer.
- Chargez le PDF source en utilisant le
DocumentAPI (ap.Document()). - Créez un nouveau
Documentpour contenir la page extraite. - Ajoutez le souhaité
Pagedu document source vers le nouveau PDF en utilisant le document de destinationPageCollection(dst_document.pages.add(...)).- Dans cet exemple, la page 2 est extraite (indexation à partir de 1).
- Enregistrez le nouveau
Documentavec la page extraite vers le fichier de sortie spécifié.
import aspose.pdf as ap
def extract_page(input_file_name: str, output_file_name: str) -> None:
src_document = ap.Document(input_file_name)
dst_document = ap.Document()
dst_document.pages.add(src_document.pages[2])
dst_document.save(output_file_name)
Extraire plusieurs pages d’un PDF
Extrayez plusieurs pages spécifiques d’un document PDF et enregistrez-les dans un nouveau fichier. En utilisant la bibliothèque Aspose.PDF, les pages sélectionnées sont copiées dans un nouveau PDF tout en laissant le document original intact. Cela est utile pour créer des PDF plus petits contenant uniquement les sections pertinentes d’un document plus volumineux.
- Chargez le PDF source en utilisant le
DocumentAPI (ap.Document()). - Créez un nouveau
Documentpour contenir les pages extraites. - Sélectionnez les pages à extraire (dans cet exemple, les pages 2 et 3 en utilisant une indexation à partir de 1).
- Ajoutez chaque sélectionné
Pagedu document source au nouveau PDF en utilisant sonPageCollection. - Enregistrez le nouveau
Documentavec les pages extraites vers le fichier de sortie spécifié.
import aspose.pdf as ap
def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
document = ap.Document(input_file_name)
pages = [2, 3]
another_document = ap.Document()
for page_index in pages:
another_document.pages.add(document.pages[page_index])
another_document.save(output_file_name)