Convertir PDF en Excel

Aspose.PDF pour l’API Java vous permet de rendre vos fichiers PDF aux formats de fichiers Excel XLS et XLSX. Nous avons déjà une autre API, connue sous le nom de Aspose.Cells pour Java, qui offre la capacité de créer et manipuler des classeurs Excel existants. Elle offre également la capacité de transformer des classeurs Excel en format PDF.

Convertir PDF en Excel XLS

Pour convertir des fichiers PDF au format XLS, Aspose.PDF dispose d’une classe appelée ExcelSaveOptions. Un objet de la classe ExcelSaveOptions est passé comme deuxième argument à la méthode Document.Save(..).

La conversion d’un fichier PDF en format XLSX fait partie de la bibliothèque Aspose.PDF pour Java version 18.6. Afin de convertir des fichiers PDF en format XLSX, vous devez définir le format en tant que XLSX en utilisant la méthode setFormat() de la classe ExcelSaveOptions.

Le code suivant montre comment convertir un fichier PDF en format xls et .xlsx :

package com.aspose.pdf.examples;

import java.io.IOException;
import java.nio.file.Path;
import java.nio.file.Paths;

import com.aspose.pdf.*;

public final class ConvertPDFtoXLSX {

    private ConvertPDFtoXLSX() {

    }

    // Le chemin vers le répertoire des documents.
    private static Path _dataDir = Paths.get("/home/admin1/pdf-examples/Samples");

    public static void main(String[] args) throws IOException {

        ConvertPDFtoExcelSimple();
        ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst();
        ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets();
        ConvertPDFtoExcelAdvanced_SaveXLSX();
    }

    public static void ConvertPDFtoExcelSimple() {
        // Charger le document PDF
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // Instancier l'objet ExcelSave Option
        ExcelSaveOptions excelsave = new ExcelSaveOptions();

        // Enregistrer la sortie au format XLS
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }
}

Convertir PDF en XLS avec colonne de contrôle

Lorsque vous convertissez un PDF au format XLS, une colonne vide est ajoutée au fichier de sortie comme première colonne. Dans la classe ExcelSaveOptions, l’option InsertBlankColumnAtFirst est utilisée pour contrôler cette colonne. Sa valeur par défaut est true.

    public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst() {
        // Charger le document PDF
        Document pdfDocument = new Document(_dataDir + "input.pdf");
        // Instancier l'objet ExcelSave Option
        ExcelSaveOptions excelsave = new ExcelSaveOptions();
        excelsave.setInsertBlankColumnAtFirst(false);
        // Enregistrer la sortie au format XLS
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }

Convertir un PDF en une seule feuille de calcul Excel

Lors de l’exportation d’un fichier PDF avec beaucoup de pages vers XLS, chaque page est exportée vers une feuille différente dans le fichier Excel. Cela est dû au fait que la propriété MinimizeTheNumberOfWorksheets est définie sur false par défaut. Pour assurer que toutes les pages soient exportées sur une seule feuille dans le fichier Excel de sortie, définissez la propriété MinimizeTheNumberOfWorksheets sur true.

    public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets() {
        // Charger le document PDF
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // Instancier l'objet ExcelSave Option
        ExcelSaveOptions excelsave = new ExcelSaveOptions();
        excelsave.setMinimizeTheNumberOfWorksheets(true);

        // Enregistrer la sortie au format XLS
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }

Convertir au format XLSX

Par défaut, Aspose.PDF utilise XML Spreadsheet 2003 pour stocker les données. Afin de convertir des fichiers PDF au format XLSX, Aspose.PDF dispose d’une classe appelée ExcelSaveOptions avec Format. Un objet de la classe ExcelSaveOptions est passé comme second argument à la méthode Document.Save(..).

    public static void ConvertPDFtoExcelAdvanced_SaveXLSX() {
        // Charger le document PDF
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // Instancier l'objet ExcelSave Option
        ExcelSaveOptions excelSave = new ExcelSaveOptions();
        excelSave.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);

        // Enregistrer la sortie au format XLS
        pdfDocument.save("PDFToXLS_out.xlsx", excelSave);
    }