Convertir PDF en Excel en Python

Aperçu

Cet article explique comment convertir des PDF en formats Excel en utilisant Python. Il couvre les sujets suivants.

Format: XLS

Format: XLSX

Format: Excel

Format: CSV

Format: ODS

Conversion de PDF en EXCEL via Python

Aspose.PDF pour Python via .NET prend en charge la fonctionnalité de conversion de fichiers PDF en formats Excel et CSV.

Aspose.PDF pour Python via .NET est un composant de manipulation de PDF, nous avons introduit une fonctionnalité qui rend le fichier PDF en classeur Excel (fichiers XLSX). Lors de cette conversion, les pages individuelles du fichier PDF sont converties en feuilles de calcul Excel.

Le code suivant montre le processus de conversion d’un fichier PDF en format XLS ou XLSX avec Aspose.PDF pour Python via .NET.

Étapes: Convertir PDF en XLS en Python

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions.
  3. Enregistrez-le au format XLS en spécifiant l’extension .xls en appelant la méthode Document.Save() et en lui passant ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

    # Enregistrer le fichier au format MS Excel
    document.save(output_pdf, save_option)

Étapes : Convertir un PDF en XLSX en Python

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions.
  3. Enregistrez-le au format XLSX en spécifiant l’extension .xlsx en appelant la méthode save() et en lui passant ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()

    # Enregistrer le fichier au format MS Excel
    document.save(output_pdf, save_option)

Convertir un PDF en XLS avec contrôle de la colonne

Lors de la conversion d’un PDF au format XLS, une colonne vide est ajoutée au fichier de sortie en tant que première colonne. La fonction InsertBlankColumnAtFirst dans la classe ‘ExcelSaveOptions’ est utilisée pour contrôler cette colonne. Sa valeur par défaut est vraie.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    save_option.insert_blank_column_at_first = True

    # Enregistrer le fichier au format MS Excel
    document.save(output_pdf, save_option)

Convertir un PDF en une seule feuille de calcul Excel

Lors de l’exportation d’un fichier PDF avec beaucoup de pages vers XLS, chaque page est exportée vers une feuille différente dans le fichier Excel. Cela est dû au fait que la propriété MinimizeTheNumberOfWorksheets est définie sur false par défaut. Pour garantir que toutes les pages sont exportées vers une seule feuille dans le fichier Excel de sortie, définissez la propriété MinimizeTheNumberOfWorksheets sur true.

Étapes : Convertir un PDF en une seule feuille de calcul XLS ou XLSX en Python

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions avec MinimizeTheNumberOfWorksheets = true.
  3. Enregistrez-le au format XLS ou XLSX avec une seule feuille de calcul en appelant la méthode save() et en lui passant ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "many_pages.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    save_option.minimize_the_number_of_worksheets = True

    # Enregistrez le fichier au format MS Excel
    document.save(output_pdf, save_option)

Convertir en d’autres formats de tableur

Convertir en CSV

La conversion au format CSV se réalise de la même manière que ci-dessus. Tout ce dont vous avez besoin - c’est de définir le format approprié.

Étapes : Convertir PDF en CSV en Python

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions avec Format = ExcelSaveOptions.ExcelFormat.CSV
  3. Enregistrez-le au format CSV en appelant la méthode save() et en lui passant ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_csv.csv"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.CSV

    # Enregistrer le fichier
    document.save(output_pdf, save_option)

Convertir en ODS

Étapes : Convertir un PDF en ODS en Python

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Créez une instance de ExcelSaveOptions avec Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Enregistrez-le au format ODS en appelant la méthode save() et en lui passant ExcelSaveOptions.

La conversion au format ODS est effectuée de la même manière que pour tous les autres formats.


    import aspose.pdf as ap
    
    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_ods.ods"
    # Ouvrir le document PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.ODS

    # Enregistrer le fichier
    document.save(output_pdf, save_option)

Voir Aussi

Cet article couvre également ces sujets. Les codes sont les mêmes qu’au-dessus.

Format: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS