Extraire des Images depuis un Fichier PDF en utilisant Python

Avez-vous besoin de séparer les images de vos fichiers PDF ? Pour une gestion simplifiée, l’archivage, l’analyse ou le partage des images de vos documents, utilisez Aspose.PDF pour Python et extrayez des images de fichiers PDF.

Les images sont conservées dans la collection resources de chaque page dans la collection XImage. Pour extraire une page particulière, récupérez ensuite l’image de la collection d’images en utilisant l’index particulier de l’image.

L’index de l’image renvoie un objet XImage. Cet objet fournit une méthode save() qui peut être utilisée pour enregistrer l’image extraite. Le fragment de code suivant montre comment extraire des images d’un fichier PDF.


    import aspose.pdf as ap

    # Ouvrir le document
    document = ap.Document(input_file)

    # Extraire une image particulière
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Enregistrer l'image de sortie
    xImage.save(outputImage)
    outputImage.close()

Supprimer des images d'un fichier PDF à l'aide de Python