Konversi PDF ke Excel dengan Python

Konversi PDF ke Excel dengan Python

Aspose.PDF for Python via .NET mendukung konversi file PDF ke Excel dan format spreadsheet lainnya dari kode Python.

Gunakan halaman ini ketika Anda perlu mengonversi PDF ke XLS, XLSX, CSV, atau ODS untuk ekstraksi tabel, penggunaan kembali laporan, penyortiran, penyaringan, atau analisis lanjutan. Selama konversi PDF ke Excel, halaman PDF individual dapat dirender sebagai lembar kerja Excel.

Contoh pertama mengonversi file PDF ke format Spreadsheet 2003 XML. Bagian selanjutnya menunjukkan XLSX, XLSM, CSV, ODS, dan output lembar kerja tunggal.

Potongan kode berikut menunjukkan proses mengonversi file PDF ke format XLS atau XLSX dengan Aspose.PDF for Python via .NET.

Langkah-langkah: Mengonversi file PDF ke format Excel (XML Spreadsheet 2003)

  1. Muat dokumen PDF.
  2. Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
  3. Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_spread_sheet2003(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi PDF ke XLSX di Python

Langkah: Mengonversi file PDF ke format XLSX (Excel 2007+)

  1. Muat dokumen PDF.
  2. Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
  3. Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi PDF ke XLSX dengan Kontrol Kolom

Saat mengonversi PDF ke format Excel, kolom kosong dapat ditambahkan sebagai kolom pertama dalam file output. Gunakan insert_blank_column_at_first opsi dari ExcelSaveOptions kelas untuk mengendalikan perilaku ini. Nilai defaultnya adalah true.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_control_column(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.insert_blank_column_at_first = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Ubah PDF menjadi Satu Lembar Kerja Excel

Aspose.PDF for Python via .NET menunjukkan cara mengonversi PDF menjadi file Excel (.xlsx), dengan opsi ‘minimize_the_number_of_worksheets’ diaktifkan.

Langkah: Mengonversi PDF ke XLS atau XLSX Lembar Kerja Tunggal dalam Python

  1. Muat dokumen PDF.
  2. Atur opsi penyimpanan Excel menggunakan ExcelSaveOptions.
  3. Opsi ‘minimize_the_number_of_worksheets’ mengurangi jumlah lembar Excel dengan menggabungkan halaman PDF menjadi lebih sedikit lembar kerja (misalnya, satu lembar kerja untuk seluruh dokumen jika memungkinkan).
  4. Simpan file yang dikonversi.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_single_excel_worksheet(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSX
    save_options.minimize_the_number_of_worksheets = True
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi PDF ke Excel 2007 Macro-Enabled (XLSM)

Contoh Python ini menunjukkan cara mengonversi file PDF menjadi file Excel dalam format XLSM (Workbook Excel yang Mendukung Makro).

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_macro(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.XLSM
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi ke format spreadsheet lainnya

Konversi PDF ke CSV

Fungsi ‘convert_pdf_to_excel_2007_csv’ melakukan operasi yang sama seperti sebelumnya, tetapi kali ini format targetnya adalah CSV (Comma-Separated Values) alih-alih XLSM.

Langkah: Konversi PDF ke CSV dalam Python

  1. Buat sebuah instance dari Dokumen objek dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan ExcelSaveOptions.ExcelFormat.CSV
  3. Simpan ke format CSV dengan memanggil save()* metode dan melewatkannya ExcelSaveOptions.
from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_excel_2007_csv(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.CSV
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi PDF ke ODS

Langkah: Konversi PDF ke ODS di Python

  1. Buat sebuah instance dari Dokumen objek dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan ExcelSaveOptions.ExcelFormat.ODS
  3. Simpan dalam format ODS dengan memanggil save() metode dan melewatkannya ExcelSaveOptions.

Konversi ke format ODS dilakukan dengan cara yang sama seperti semua format lainnya.

from os import path
import aspose.pdf as ap
import sys

def convert_pdf_to_ods(infile, outfile):
    document = ap.Document(infile)
    save_options = ap.ExcelSaveOptions()
    save_options.format = ap.ExcelSaveOptions.ExcelFormat.ODS
    document.save(outfile, save_options)

    print(infile + " converted into " + outfile)

Konversi terkait