Convertir PDF en Excel en Python
Aperçu
Cet article explique comment convertir des PDF en formats Excel en utilisant Python. Il couvre les sujets suivants.
Format: XLS
Format: XLSX
Format: Excel
Format: CSV
Format: ODS
Conversion de PDF en EXCEL via Python
Aspose.PDF pour Python via .NET prend en charge la fonctionnalité de conversion de fichiers PDF en formats Excel et CSV.
Aspose.PDF pour Python via .NET est un composant de manipulation de PDF, nous avons introduit une fonctionnalité qui rend le fichier PDF en classeur Excel (fichiers XLSX). Lors de cette conversion, les pages individuelles du fichier PDF sont converties en feuilles de calcul Excel.
Essayez de convertir PDF en Excel en ligne
Aspose.PDF vous présente l’application en ligne gratuite “PDF to XLSX”, où vous pouvez essayer d’examiner la fonctionnalité et la qualité de son fonctionnement.
Le code suivant montre le processus de conversion d’un fichier PDF en format XLS ou XLSX avec Aspose.PDF pour Python via .NET.
Étapes: Convertir PDF en XLS en Python
- Créez une instance de l’objet Document avec le document PDF source.
- Créez une instance de ExcelSaveOptions.
- Enregistrez-le au format XLS en spécifiant l’extension .xls en appelant la méthode Document.Save() et en lui passant ExcelSaveOptions.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
# Enregistrer le fichier au format MS Excel
document.save(output_pdf, save_option)
Étapes : Convertir un PDF en XLSX en Python
- Créez une instance de l’objet Document avec le document PDF source.
- Créez une instance de ExcelSaveOptions.
- Enregistrez-le au format XLSX en spécifiant l’extension .xlsx en appelant la méthode save() et en lui passant ExcelSaveOptions.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
# Enregistrer le fichier au format MS Excel
document.save(output_pdf, save_option)
Convertir un PDF en XLS avec contrôle de la colonne
Lors de la conversion d’un PDF au format XLS, une colonne vide est ajoutée au fichier de sortie en tant que première colonne. La fonction InsertBlankColumnAtFirst dans la classe ‘ExcelSaveOptions’ est utilisée pour contrôler cette colonne. Sa valeur par défaut est vraie.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True
# Enregistrer le fichier au format MS Excel
document.save(output_pdf, save_option)
Convertir un PDF en une seule feuille de calcul Excel
Lors de l’exportation d’un fichier PDF avec beaucoup de pages vers XLS, chaque page est exportée vers une feuille différente dans le fichier Excel. Cela est dû au fait que la propriété MinimizeTheNumberOfWorksheets est définie sur false par défaut. Pour garantir que toutes les pages sont exportées vers une seule feuille dans le fichier Excel de sortie, définissez la propriété MinimizeTheNumberOfWorksheets sur true.
Étapes : Convertir un PDF en une seule feuille de calcul XLS ou XLSX en Python
- Créez une instance de l’objet Document avec le document PDF source.
- Créez une instance de ExcelSaveOptions avec MinimizeTheNumberOfWorksheets = true.
- Enregistrez-le au format XLS ou XLSX avec une seule feuille de calcul en appelant la méthode save() et en lui passant ExcelSaveOptions.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "many_pages.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True
# Enregistrez le fichier au format MS Excel
document.save(output_pdf, save_option)
Convertir en d’autres formats de tableur
Convertir en CSV
La conversion au format CSV se réalise de la même manière que ci-dessus. Tout ce dont vous avez besoin - c’est de définir le format approprié.
Étapes : Convertir PDF en CSV en Python
- Créez une instance de l’objet Document avec le document PDF source.
- Créez une instance de ExcelSaveOptions avec Format = ExcelSaveOptions.ExcelFormat.CSV
- Enregistrez-le au format CSV en appelant la méthode save() et en lui passant ExcelSaveOptions.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_csv.csv"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.CSV
# Enregistrer le fichier
document.save(output_pdf, save_option)
Convertir en ODS
Étapes : Convertir un PDF en ODS en Python
- Créez une instance de l’objet Document avec le document PDF source.
- Créez une instance de ExcelSaveOptions avec Format = ExcelSaveOptions.ExcelFormat.ODS
- Enregistrez-le au format ODS en appelant la méthode save() et en lui passant ExcelSaveOptions.
La conversion au format ODS est effectuée de la même manière que pour tous les autres formats.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_ods.ods"
# Ouvrir le document PDF
document = ap.Document(input_pdf)
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.ODS
# Enregistrer le fichier
document.save(output_pdf, save_option)
Voir Aussi
Cet article couvre également ces sujets. Les codes sont les mêmes qu’au-dessus.
Format: Excel
- Python PDF to Excel Code
- Python PDF to Excel API
- Python PDF to Excel Programmatically
- Python PDF to Excel Library
- Python Save PDF as Excel
- Python Generate Excel from PDF
- Python Create Excel from PDF
- Python PDF to Excel Converter
Format: XLS
- Python PDF to XLS Code
- Python PDF to XLS API
- Python PDF to XLS Programmatically
- Python PDF to XLS Library
- Python Save PDF as XLS
- Python Generate XLS from PDF
- Python Create XLS from PDF
- Python PDF to XLS Converter
Format: XLSX
- Python PDF to XLSX Code
- API Python PDF to XLSX
- Programme Python PDF to XLSX
- Bibliothèque Python PDF to XLSX
- Enregistrer PDF en tant que XLSX avec Python
- Générer XLSX à partir de PDF avec Python
- Créer XLSX à partir de PDF avec Python
- Convertisseur Python PDF to XLSX
Format: CSV
- Code Python PDF to CSV
- API Python PDF to CSV
- Programme Python PDF to CSV
- Bibliothèque Python PDF to CSV
- Enregistrer PDF en tant que CSV avec Python
- Générer CSV à partir de PDF avec Python
- Créer CSV à partir de PDF avec Python
- Convertisseur Python PDF to CSV
Format: ODS