Convertir PDF en EPUB, LaTeX, Texte, XPS en C#

Convertir PDF en EPUB

EPUB est une norme de livre électronique gratuite et ouverte de l’International Digital Publishing Forum (IDPF). EPUB est un standard de livre électronique libre et ouvert de l’International Digital Publishing Forum (IDPF). EPUB est conçu pour un contenu refluant, ce qui signifie qu’un lecteur EPUB peut optimiser le texte pour un dispositif d’affichage particulier. EPUB prend également en charge le contenu à mise en page fixe. Le format est destiné comme un format unique que les éditeurs et les maisons de conversion peuvent utiliser en interne, ainsi que pour la distribution et la vente. Il remplace la norme Open eBook.

Le code suivant fonctionne également avec la bibliothèque Aspose.PDF.Drawing.

Aspose.PDF pour .NET prend également en charge la fonctionnalité de conversion de documents PDF au format EPUB. Aspose.PDF pour .NET dispose d’une classe nommée EpubSaveOptions qui peut être utilisée comme second argument à la méthode Document.Save(..), pour générer un fichier EPUB. Veuillez essayer d’utiliser le code suivant pour accomplir cette exigence avec C#.

// Pour des exemples complets et des fichiers de données, veuillez aller sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Le chemin vers le répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Charger le document PDF
Document pdfDocument = new Document(dataDir + "PDFToEPUB.pdf");
// Instancier les options de sauvegarde Epub
EpubSaveOptions options = new EpubSaveOptions();
// Spécifier la mise en page pour le contenu
options.ContentRecognitionMode = EpubSaveOptions.RecognitionMode.Flow;
// Sauvegarder le document ePUB
pdfDocument.Save(dataDir + "PDFToEPUB_out.epub", options);

Convertir PDF en LaTeX/TeX

Aspose.PDF pour .NET prend en charge la conversion de PDF en LaTeX/TeX. Le format de fichier LaTeX est un format de fichier texte avec un balisage spécial et utilisé dans le système de préparation de documents basé sur TeX pour une composition de haute qualité.

Pour convertir des fichiers PDF en TeX, Aspose.PDF dispose de la classe LaTeXSaveOptions qui fournit la propriété OutDirectoryPath pour sauvegarder les images temporaires pendant le processus de conversion.

Le fragment de code suivant montre le processus de conversion de fichiers PDF au format TEX avec C#.

// Pour des exemples complets et des fichiers de données, veuillez aller à https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Le chemin vers le répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Créer un objet Document
Aspose.Pdf.Document doc = new Aspose.Pdf.Document(dataDir + "PDFToTeX.pdf");

// Instancier l'option de sauvegarde LaTex          
LaTeXSaveOptions saveOptions = new LaTeXSaveOptions();

// Spécifier le répertoire de sortie
string pathToOutputDirectory = dataDir;

// Définir le chemin du répertoire de sortie pour l'objet option de sauvegarde
saveOptions.OutDirectoryPath = pathToOutputDirectory;

// Sauvegarder le fichier PDF au format LaTex           
doc.Save(dataDir + "PDFToTeX_out.tex", saveOptions);

Convertir PDF en Texte

Aspose.PDF pour .NET prend en charge la conversion de l’ensemble du document PDF et d’une seule page en fichier Texte.

Convertir l’ensemble du document PDF en fichier Texte

Vous pouvez convertir un document PDF en fichier TXT en utilisant la méthode Visit de la classe TextAbsorber.

Le fragment de code suivant explique comment extraire les textes de toutes les pages.

public static void ConvertPDFDocToTXT()
{
    // Ouvrir le document
    Document pdfDocument = new Document(_dataDir + "demo.pdf");
    TextAbsorber ta = new TextAbsorber();
    ta.Visit(pdfDocument);
    // Sauvegarder le texte extrait dans un fichier texte
    File.WriteAllText(_dataDir + "input_Text_Extracted_out.txt",ta.Text);
}

Convertir une page PDF en fichier texte

Vous pouvez convertir un document PDF en fichier TXT avec Aspose.PDF pour .NET. Vous devriez utiliser la méthode Visit de la classe TextAbsorber pour résoudre cette tâche.

Le code suivant explique comment extraire les textes des pages spécifiques.

public static void ConvertPDFPagestoTXT()
{
    Document pdfDocument = new Document(System.IO.Path.Combine(_dataDir, "demo.pdf"));
    TextAbsorber ta = new TextAbsorber();
    var pages = new [] {1, 3, 4};
    foreach (var page in pages)
    {
        ta.Visit(pdfDocument.Pages[page]);
    }
   
    // Sauvegarder le texte extrait dans un fichier texte
    File.WriteAllText(System.IO.Path.Combine(_dataDir, "input_Text_Extracted_out.txt"), ta.Text);
}

Convertir PDF en XPS

Aspose.PDF pour .NET offre la possibilité de convertir des fichiers PDF au format XPS. Essayons d’utiliser l’extrait de code présenté pour convertir des fichiers PDF en format XPS avec C#.

Le type de fichier XPS est principalement associé à la spécification de papier XML par Microsoft Corporation. La Spécification de Papier XML (XPS), anciennement connue sous le nom de code Metro et englobant le concept marketing de Next Generation Print Path (NGPP), est l’initiative de Microsoft pour intégrer la création et la visualisation de documents dans le système d’exploitation Windows.

Pour convertir des fichiers PDF en XPS, Aspose.PDF dispose de la classe XpsSaveOptions qui est utilisée comme second argument de la méthode Document.Save(..) pour générer le fichier XPS. Pour convertir des fichiers PDF en XPS, Aspose.PDF utilise la classe XpsSaveOptions qui est utilisée comme second argument dans la méthode Document.Save(..) pour générer le fichier XPS.

Le fragment de code suivant montre le processus de conversion d’un fichier PDF en format XPS.

// Pour des exemples complets et des fichiers de données, veuillez aller sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Le chemin vers le répertoire des documents.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Charger le document PDF
Document pdfDocument = new Document(dataDir + "input.pdf");

// Instancier les options de sauvegarde XPS
Aspose.Pdf.XpsSaveOptions saveOptions = new Aspose.Pdf.XpsSaveOptions();
// Sauvegarder le document XPS
pdfDocument.Save("PDFToXPS_out.xps", saveOptions)