Convertir le PDF en Excel avec Python

Convertir le PDF en Excel (Spreadsheet 2003 XML)

Aspose.PDF for Python via .NET prend en charge la fonctionnalité de conversion des fichiers PDF aux formats Excel et CSV.

Aspose.PDF for Python via .NET est un composant de manipulation de PDF, nous avons introduit une fonctionnalité qui rend le fichier PDF en classeur Excel (fichiers XLSX). Au cours de cette conversion, les pages individuelles du fichier PDF sont converties en feuilles de calcul Excel.

Utilisez cette page lorsque vous devez extraire du contenu PDF orienté tableau ou de type rapport en formats de feuille de calcul pour le trier, le filtrer ou l’analyser en aval.

Le fragment de code suivant montre le processus de conversion d’un fichier PDF en format XLS ou XLSX avec Aspose.PDF for Python via .NET.

Étapes : Convertir un fichier PDF en format Excel (XML Spreadsheet 2003)

  1. Chargez le document PDF.
  2. Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
  3. Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir le PDF en Excel 2007+ (XLSX)

Étapes : Convertir un fichier PDF au format XLSX (Excel 2007+)

  1. Chargez le document PDF.
  2. Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
  3. Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir le PDF en XLS avec la colonne de contrôle

Lors de la conversion d’un PDF au format XLS, une colonne vierge est ajoutée au fichier de sortie en tant que première colonne. Dans la classe ‘ExcelSaveOptions’, l’option ‘insert_blank_column_at_first’ est utilisée pour contrôler cette colonne. Sa valeur par défaut est true.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_control_column(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.insert_blank_column_at_first = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir le PDF en une feuille Excel unique

Aspose.PDF for Python via .NET montre comment convertir un PDF en fichier Excel (.xlsx), avec l’option ‘minimize_the_number_of_worksheets’ activée.

Étapes : Convertir le PDF en XLS ou XLSX avec une seule feuille de calcul en Python

  1. Chargez le document PDF.
  2. Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
  3. L’option ‘minimize_the_number_of_worksheets’ réduit le nombre de feuilles Excel en combinant les pages PDF en moins de feuilles de calcul (par exemple, une feuille de calcul pour l’ensemble du document si possible).
  4. Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.minimize_the_number_of_worksheets = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir le PDF en Excel 2007 avec macros activées (XLSM)

Cet exemple Python montre comment convertir un fichier PDF en un fichier Excel au format XLSM (Classeur Excel avec macros).

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_macro(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir vers d’autres formats de feuilles de calcul

Convertir le PDF en CSV

La fonction ‘convert_pdf_to_excel_2007_csv’ effectue la même opération qu’auparavant, mais cette fois le format cible est CSV (Comma-Separated Values) au lieu de XLSM.

Étapes : Convertir le PDF en CSV en Python

  1. Créer une instance de Document objet avec le document PDF source.
  2. Créer une instance de ExcelSaveOptions avec ExcelSaveOptions.ExcelFormat.CSV
  3. Enregistrez‑le au format CSV en appelant save()* méthode et le passer ExcelSaveOptions.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_csv(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Convertir PDF en ODS

Étapes : Convertir le PDF en ODS en Python

  1. Créer une instance de Document objet avec le document PDF source.
  2. Créer une instance de ExcelSaveOptions avec ExcelSaveOptions.ExcelFormat.ODS
  3. Enregistrez-le au format ODS en appelant save() méthode et la passer ExcelSaveOptions.

La conversion au format ODS s’effectue de la même manière que tous les autres formats.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_ods(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Conversions associées