Convertir PDF en EPUB, LaTeX, Texte, XPS en Python

Convertir PDF en EPUB

EPUB est une norme de livre électronique libre et ouverte de l’International Digital Publishing Forum (IDPF). Les fichiers ont l’extension .epub.
EPUB est conçu pour un contenu reformatable, ce qui signifie qu’un lecteur EPUB peut optimiser le texte pour un appareil d’affichage particulier. EPUB prend également en charge le contenu à mise en page fixe. Le format est destiné à être un format unique que les éditeurs et les maisons de conversion peuvent utiliser en interne, ainsi que pour la distribution et la vente. Il remplace la norme Open eBook.

Aspose.PDF pour Python prend également en charge la fonctionnalité de conversion de documents PDF au format EPUB. Aspose.PDF pour Python a une classe nommée ‘EpubSaveOptions’ qui peut être utilisée comme deuxième argument de la méthode save(), pour générer un fichier EPUB.
Veuillez essayer d’utiliser l’extrait de code suivant pour accomplir cette tâche avec Python.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_epub.epub"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    # Instancier les options de sauvegarde Epub
    save_options = ap.EpubSaveOptions()

    # Spécifier la mise en page pour le contenu
    save_options.content_recognition_mode = ap.EpubSaveOptions.RecognitionMode.FLOW

    # Enregistrer le document EPUB
    document.save(output_pdf, save_options)

Convertir PDF en LaTeX/TeX

Aspose.PDF pour Python via .NET prend en charge la conversion de PDF en LaTeX/TeX. Le format de fichier LaTeX est un format de fichier texte avec une balise spéciale utilisée dans le système de préparation de documents basé sur TeX pour une composition de haute qualité.

Pour convertir des fichiers PDF en TeX, Aspose.PDF dispose de la classe LaTeXSaveOptions qui fournit la propriété OutDirectoryPath pour enregistrer des images temporaires pendant le processus de conversion.

L’extrait de code suivant montre le processus de conversion de fichiers PDF en format TEX avec Python.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_tex.tex"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)
    # Instancier un objet de LaTeXSaveOptions
    saveOptions = ap.LaTeXSaveOptions()
    document.save(output_pdf, saveOptions)

Convertir PDF en Texte

Aspose.PDF pour Python prend en charge la conversion de l’ensemble du document PDF et de la page unique en un fichier texte.

Convertir un document PDF en fichier texte

Vous pouvez convertir un document PDF en fichier TXT en utilisant la classe ‘TextDevice’.

Le code suivant explique comment extraire les textes de toutes les pages.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf =  DIR_OUTPUT + "convert_pdf_to_txt.txt"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    # Créer un dispositif de texte
    textDevice = ap.devices.TextDevice()

    # Convertir une page particulière et enregistrer
    textDevice.process(document.pages[1], output_pdf)

Essayez de convertir Convertir PDF en Texte en ligne

Aspose.PDF pour Python vous présente l’application gratuite en ligne “PDF en Texte”, où vous pouvez essayer d’examiner la fonctionnalité et la qualité de son fonctionnement.

Convertir PDF en XPS

Aspose.PDF pour Python offre la possibilité de convertir des fichiers PDF au format XPS. Essayons d’utiliser l’extrait de code présenté pour convertir des fichiers PDF au format XPS avec Python.

Le type de fichier XPS est principalement associé à la spécification XML Paper Specification par Microsoft Corporation. La spécification XML Paper Specification (XPS), anciennement nommée Metro et englobant le concept marketing Next Generation Print Path (NGPP), est l’initiative de Microsoft pour intégrer la création et la visualisation de documents dans le système d’exploitation Windows.

Pour convertir des fichiers PDF en XPS, Aspose.PDF dispose de la classe XpsSaveOptions qui est utilisée comme deuxième argument de la méthode save() pour générer le fichier XPS.

Le fragment de code suivant montre le processus de conversion d’un fichier PDF au format XPS.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xps.xps"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    # Instancier les options de sauvegarde XPS
    save_options = ap.XpsSaveOptions()

    # Enregistrer le document XPS
    document.save(output_pdf, save_options)

Convertir PDF en XML

XML est un langage de balisage et un format de fichier pour stocker, transmettre et reconstruire des données arbitraires.

Aspose.PDF pour Python prend également en charge la fonctionnalité de conversion de documents PDF en format XML. Aspose.PDF pour Python a une classe nommée ‘XmlSaveOptions’ qui peut être utilisée comme second argument dans la méthode save(), pour générer un fichier XML. Veuillez essayer d’utiliser l’extrait de code suivant pour répondre à cette exigence avec Python.


    import aspose.pdf as ap

    def convert_pdf_to_xml(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Ouvrir le document PDF

        document = ap.Document(path_infile)

        # Instancier les options de sauvegarde XML
        save_options = ap.XmlSaveOptions()

        # Enregistrer le document XML
        document.save(path_outfile, save_options)
        print(infile + " converti en " + outfile)