Convertir le PDF en Excel avec Python
Convertir le PDF en Excel (Spreadsheet 2003 XML)
Aspose.PDF for Python via .NET prend en charge la fonctionnalité de conversion des fichiers PDF aux formats Excel et CSV.
Aspose.PDF for Python via .NET est un composant de manipulation de PDF, nous avons introduit une fonctionnalité qui rend le fichier PDF en classeur Excel (fichiers XLSX). Au cours de cette conversion, les pages individuelles du fichier PDF sont converties en feuilles de calcul Excel.
Utilisez cette page lorsque vous devez extraire du contenu PDF orienté tableau ou de type rapport en formats de feuille de calcul pour le trier, le filtrer ou l’analyser en aval.
Essayez de convertir le PDF en Excel en ligne
Aspose.PDF vous présente une application en ligne “PDF vers XLSX”, où vous pouvez essayer d’examiner le fonctionnement et la qualité.
Le fragment de code suivant montre le processus de conversion d’un fichier PDF en format XLS ou XLSX avec Aspose.PDF for Python via .NET.
Étapes : Convertir un fichier PDF en format Excel (XML Spreadsheet 2003)
- Chargez le document PDF.
- Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
- Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir le PDF en Excel 2007+ (XLSX)
Étapes : Convertir un fichier PDF au format XLSX (Excel 2007+)
- Chargez le document PDF.
- Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
- Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir le PDF en XLS avec la colonne de contrôle
Lors de la conversion d’un PDF au format XLS, une colonne vierge est ajoutée au fichier de sortie en tant que première colonne. Dans la classe ‘ExcelSaveOptions’, l’option ‘insert_blank_column_at_first’ est utilisée pour contrôler cette colonne. Sa valeur par défaut est true.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_control_column(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
save_options.insert_blank_column_at_first = True
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir le PDF en une feuille Excel unique
Aspose.PDF for Python via .NET montre comment convertir un PDF en fichier Excel (.xlsx), avec l’option ‘minimize_the_number_of_worksheets’ activée.
Étapes : Convertir le PDF en XLS ou XLSX avec une seule feuille de calcul en Python
- Chargez le document PDF.
- Configurer les options d’enregistrement Excel en utilisant ExcelSaveOptions.
- L’option ‘minimize_the_number_of_worksheets’ réduit le nombre de feuilles Excel en combinant les pages PDF en moins de feuilles de calcul (par exemple, une feuille de calcul pour l’ensemble du document si possible).
- Enregistrez le fichier converti.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
save_options.minimize_the_number_of_worksheets = True
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir le PDF en Excel 2007 avec macros activées (XLSM)
Cet exemple Python montre comment convertir un fichier PDF en un fichier Excel au format XLSM (Classeur Excel avec macros).
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_macro(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir vers d’autres formats de feuilles de calcul
Convertir le PDF en CSV
La fonction ‘convert_pdf_to_excel_2007_csv’ effectue la même opération qu’auparavant, mais cette fois le format cible est CSV (Comma-Separated Values) au lieu de XLSM.
Étapes : Convertir le PDF en CSV en Python
- Créer une instance de Document objet avec le document PDF source.
- Créer une instance de ExcelSaveOptions avec ExcelSaveOptions.ExcelFormat.CSV
- Enregistrez‑le au format CSV en appelant save()* méthode et le passer ExcelSaveOptions.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_csv(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Convertir PDF en ODS
Étapes : Convertir le PDF en ODS en Python
- Créer une instance de Document objet avec le document PDF source.
- Créer une instance de ExcelSaveOptions avec ExcelSaveOptions.ExcelFormat.ODS
- Enregistrez-le au format ODS en appelant save() méthode et la passer ExcelSaveOptions.
La conversion au format ODS s’effectue de la même manière que tous les autres formats.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_ods(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Conversions associées
- Convertir le PDF en Word si votre priorité est le flux de texte modifiable plutôt que la structure de feuille de calcul.
- Convertir le PDF en HTML lorsque vous avez besoin d’une sortie compatible avec le navigateur.
- Convertir le PDF en d’autres formats pour EPUB, Markdown, texte, XPS et les flux de travail d’exportation associés.
