Konversi PDF ke Excel dengan Python
Konversi PDF ke Excel dengan Python
Aspose.PDF for Python via .NET mendukung konversi file PDF ke Excel dan format spreadsheet lainnya dari kode Python.
Gunakan halaman ini ketika Anda perlu mengonversi PDF ke XLS, XLSX, CSV, atau ODS untuk ekstraksi tabel, penggunaan kembali laporan, penyortiran, penyaringan, atau analisis lanjutan. Selama konversi PDF ke Excel, halaman PDF individual dapat dirender sebagai lembar kerja Excel.
Contoh pertama mengonversi file PDF ke format Spreadsheet 2003 XML. Bagian selanjutnya menunjukkan XLSX, XLSM, CSV, ODS, dan output lembar kerja tunggal.
Coba konversi PDF ke Excel secara online
Aspose.PDF mempersembahkan Anda aplikasi daring “PDF ke XLSX”, di mana Anda dapat mencoba menyelidiki fungsionalitas dan kualitas kerjanya.
Potongan kode berikut menunjukkan proses mengonversi file PDF ke format XLS atau XLSX dengan Aspose.PDF for Python via .NET.
Langkah-langkah: Mengonversi file PDF ke format Excel (XML Spreadsheet 2003)
- Muat dokumen PDF.
- Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
- Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi PDF ke XLSX di Python
Langkah: Mengonversi file PDF ke format XLSX (Excel 2007+)
- Muat dokumen PDF.
- Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
- Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi PDF ke XLSX dengan Kontrol Kolom
Saat mengonversi PDF ke format Excel, kolom kosong dapat ditambahkan sebagai kolom pertama dalam file output. Gunakan insert_blank_column_at_first opsi dari ExcelSaveOptions kelas untuk mengendalikan perilaku ini. Nilai defaultnya adalah true.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_control_column(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
save_options.insert_blank_column_at_first = True
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Ubah PDF menjadi Satu Lembar Kerja Excel
Aspose.PDF for Python via .NET menunjukkan cara mengonversi PDF menjadi file Excel (.xlsx), dengan opsi ‘minimize_the_number_of_worksheets’ diaktifkan.
Langkah: Mengonversi PDF ke XLS atau XLSX Lembar Kerja Tunggal dalam Python
- Muat dokumen PDF.
- Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
- Opsi ‘minimize_the_number_of_worksheets’ mengurangi jumlah lembar Excel dengan menggabungkan halaman PDF menjadi lebih sedikit lembar kerja (misalnya, satu lembar kerja untuk seluruh dokumen jika memungkinkan).
- Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
save_options.minimize_the_number_of_worksheets = True
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi PDF ke Excel 2007 Macro-Enabled (XLSM)
Contoh Python ini menunjukkan cara mengonversi file PDF menjadi file Excel dalam format XLSM (Workbook Excel yang Mendukung Makro).
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_macro(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi ke format spreadsheet lainnya
Konversi PDF ke CSV
Fungsi ‘convert_pdf_to_excel_2007_csv’ melakukan operasi yang sama seperti sebelumnya, tetapi kali ini format targetnya adalah CSV (Comma-Separated Values) alih-alih XLSM.
Langkah: Konversi PDF ke CSV dalam Python
- Buat sebuah instance dari Dokumen objek dengan dokumen PDF sumber.
- Buat sebuah instance dari ExcelSaveOptions dengan ExcelSaveOptions.ExcelFormat.CSV
- Simpan ke format CSV dengan memanggil save()* metode dan melewatkannya ExcelSaveOptions.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_excel_2007_csv(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi PDF ke ODS
Langkah: Konversi PDF ke ODS di Python
- Buat sebuah instance dari Dokumen objek dengan dokumen PDF sumber.
- Buat sebuah instance dari ExcelSaveOptions dengan ExcelSaveOptions.ExcelFormat.ODS
- Simpan dalam format ODS dengan memanggil save() metode dan melewatkannya ExcelSaveOptions.
Konversi ke format ODS dilakukan dengan cara yang sama seperti semua format lainnya.
from os import path
import aspose.pdf as ap
import sys
def convert_pdf_to_ods(infile, outfile):
document = ap.Document(infile)
save_options = ap.ExcelSaveOptions()
save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
document.save(outfile, save_options)
print(infile + " converted into " + outfile)
Konversi terkait
- Konversi PDF ke Word jika prioritas Anda adalah aliran teks yang dapat diedit daripada struktur spreadsheet.
- Konversi PDF ke HTML ketika Anda memerlukan output yang ramah peramban.
- Konversi PDF ke format lain untuk EPUB, Markdown, teks, XPS, dan alur kerja ekspor terkait.
