Convertir PDF en Excel en .NET

Vue d’ensemble

Cet article explique comment convertir des PDF en formats Excel en utilisant C#. Il couvre les sujets suivants.

Le code suivant fonctionne également avec la bibliothèque Aspose.PDF.Drawing.

Format : XLS

Format : XLSX

Format : Excel

Format : Feuille Excel unique

Format : Format de feuille de calcul XML 2003

Format : CSV

Format : ODS

C# Conversions de PDF en Excel

Aspose.PDF for .NET prend en charge la fonctionnalité de conversion des fichiers PDF en formats Excel 2007, CSV et SpeadsheetML. Aspose.PDF pour .NET prend en charge la fonctionnalité de conversion des fichiers PDF aux formats Excel 2007, CSV et SpeadsheetML.

Aspose.PDF pour .NET est un composant de manipulation de PDF, nous avons introduit une fonctionnalité qui permet de rendre un fichier PDF en classeur Excel (fichiers XLSX). Lors de cette conversion, les pages individuelles du fichier PDF sont converties en feuilles de calcul Excel.

Pour convertir des fichiers PDF au format XLSX, Aspose.PDF dispose d’une classe appelée ExcelSaveOptions. Pour convertir des fichiers PDF au format XLSX, Aspose.PDF possède une classe appelée ExcelSaveOptions.

Le fragment de code suivant montre le processus de conversion d’un fichier PDF en format XLS ou XLSX avec Aspose.PDF pour .NET.

Étapes : Convertir PDF en XLS en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions.
  3. Sauvegardez-le au format XLS en spécifiant l’extension .xls en appelant la méthode Document.Save() et en lui passant ExcelSaveOptions

Étapes : Convertir PDF en XLSX en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions.
  3. Sauvegardez-le au format XLSX en spécifiant l’extension .xlsx en appelant la méthode Document.Save() et en lui passant ExcelSaveOptions
// Code for converting PDF to XLS or XLSX

Convertir PDF en XLS avec contrôle de colonne

Lors de la conversion d’un PDF en format XLS, une colonne vide est ajoutée au fichier de sortie en tant que première colonne. L’option InsertBlankColumnAtFirst de la classe ExcelSaveOptions est utilisée pour contrôler cette colonne. La valeur par défaut est false, ce qui signifie que les colonnes vides ne seront pas insérées.

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // Pour des exemples complets et des fichiers de données, veuillez aller sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Charger le document PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // Instancier l'objet ExcelSave Option
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // Sauvegarder le résultat au format XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Convertir PDF en une seule feuille de calcul Excel

Lors de l’exportation d’un fichier PDF avec de nombreuses pages vers XLS, chaque page est exportée vers une feuille différente dans le fichier Excel. Cela est dû au fait que la propriété MinimizeTheNumberOfWorksheets est définie sur false par défaut. Pour s’assurer que toutes les pages soient exportées vers une seule et même feuille dans le fichier Excel final, définissez la propriété MinimizeTheNumberOfWorksheets sur true.

Étapes : Convertir PDF en feuille XLS ou XLSX unique en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions avec MinimizeTheNumberOfWorksheets = true.
  3. Enregistrez-le au format XLS ou XLSX avec une seule feuille en appelant la méthode Document.Save() et en lui passant ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // Pour des exemples complets et des fichiers de données, veuillez aller sur https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Charger le document PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Instancier l'objet ExcelSave Option
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // Sauvegarder le résultat au format XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Convertir vers d’autres formats de feuille de calcul

Convertir au format XML Spreadsheet 2003

Depuis la version 20.8, Aspose.PDF utilise par défaut le format de fichier Microsoft Excel Open XML Spreadsheet 2007 pour stocker les données. Pour convertir des fichiers PDF au format XML Spreadsheet 2003, Aspose.PDF dispose d’une classe appelée ExcelSaveOptions avec Format. Un objet de la classe ExcelSaveOptions est passé comme second argument à la méthode Document.Save(..).

Le fragment de code suivant montre le processus de conversion d’un fichier PDF en format XLS Excel 2003 XML.

Étapes : Convertir un PDF en format Excel 2003 XML en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Sauvegardez-le au format XLS - Format XML Excel 2003 en appelant la méthode Document.Save() et en passant ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // Pour des exemples complets et des fichiers de données, veuillez aller à https://github.com/aspose-pdf/Aspose.PDF-for-.NET

    // Charger le document PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Instancier l'objet ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // Sauvegarder la sortie au format XLS
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

Convertir en CSV

La conversion au format CSV se fait de la même manière que ci-dessus. Tout ce dont vous avez besoin est de définir le format approprié.

Étapes : Convertir PDF en CSV en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Enregistrez-le au format CSV en appelant la méthode Document.Save() et en passant ExcelSaveOptions.
 // Instancier l'objet ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

Convertir en ODS

Étapes : Convertir PDF en ODS en C#

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions avec Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Enregistrez-le au format ODS en appelant la méthode Document.Save() et en passant ExcelSaveOptions.

La conversion au format ODS s’effectue de la même manière que pour tous les autres formats.

 // Instancier l'objet ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

Voir aussi

Cet article couvre également ces sujets. Les codes sont les mêmes que ci-dessus.

Format : Excel

Format : XLS

Format : XLSX

Format : CSV

Format : ODS