Konversi PDF ke Excel di Python

Ikhtisar

Artikel ini menjelaskan cara mengonversi PDF ke format Excel menggunakan Python. Ini mencakup topik-topik berikut.

Format: XLS

Format: XLSX

Format: Excel

Format: CSV

Format: ODS

Konversi PDF ke EXCEL melalui Python

Aspose.PDF untuk Python via .NET mendukung fitur mengkonversi file PDF ke format Excel, dan CSV.

Aspose.PDF untuk Python via .NET adalah komponen manipulasi PDF, kami telah memperkenalkan fitur yang merender file PDF ke buku kerja Excel (file XLSX). Selama konversi ini, halaman individu dari file PDF dikonversi ke lembar kerja Excel.

Cuplikan kode berikut menunjukkan proses untuk mengonversi file PDF ke format XLS atau XLSX dengan Aspose.PDF untuk Python via .NET.

Langkah-langkah: Mengonversi PDF ke XLS di Python

  1. Buat instance dari objek Document dengan dokumen PDF sumber.
  2. Buat instance dari ExcelSaveOptions.
  3. Simpan dalam format XLS dengan menentukan ekstensi .xls dengan memanggil metode Document.Save() dan melewatkannya ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

    # Simpan file ke dalam format MS Excel
    document.save(output_pdf, save_option)

Langkah-langkah: Konversi PDF ke XLSX di Python

  1. Buat instance dari objek Document dengan dokumen PDF sumber.
  2. Buat instance dari ExcelSaveOptions.
  3. Simpan ke format XLSX dengan menentukan ekstensi .xlsx dengan memanggil metode save() dan melewatkannya ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()

    # Simpan file ke dalam format MS Excel
    document.save(output_pdf, save_option)

Konversi PDF ke XLS dengan kontrol Kolom

Saat mengonversi PDF ke format XLS, kolom kosong ditambahkan ke file keluaran sebagai kolom pertama. Dalam opsi ‘ExcelSaveOptions class’ InsertBlankColumnAtFirst digunakan untuk mengontrol kolom ini. Nilai defaultnya adalah true.


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    save_option.insert_blank_column_at_first = True

    # Simpan file ke dalam format MS Excel
    document.save(output_pdf, save_option)

Mengonversi PDF ke Lembar Kerja Excel Tunggal

Saat mengekspor file PDF dengan banyak halaman ke XLS, setiap halaman diekspor ke lembar yang berbeda dalam file Excel. Ini karena properti MinimizeTheNumberOfWorksheets diatur ke false secara default. Untuk memastikan bahwa semua halaman diekspor ke satu lembar saja dalam file Excel keluaran, atur properti MinimizeTheNumberOfWorksheets ke true.

Langkah-langkah: Mengonversi PDF ke Lembar Kerja XLS atau XLSX Tunggal di Python

  1. Buat instance objek Document dengan dokumen PDF sumber.
  2. Buat instance ExcelSaveOptions dengan MinimizeTheNumberOfWorksheets = true.
  3. Simpan ke format XLS atau XLSX dengan satu worksheet dengan memanggil metode save() dan meneruskannya ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "many_pages.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
    save_option.minimize_the_number_of_worksheets = True

    # Simpan file ke dalam format MS Excel
    document.save(output_pdf, save_option)

Konversi ke format spreadsheet lain

Konversi ke CSV

Konversi ke format CSV dilakukan dengan cara yang sama seperti di atas. Yang Anda butuhkan - setel format yang sesuai.

Langkah-langkah: Konversi PDF ke CSV dalam Python

  1. Buat instance objek Document dengan dokumen PDF sumber.
  2. Buat instance ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.CSV
  3. Simpan ke format CSV dengan memanggil metode save()* dan melewatkannya ExcelSaveOptions.

    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_csv.csv"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.CSV

    # Simpan file
    document.save(output_pdf, save_option)

Konversi ke ODS

Langkah-langkah: Konversi PDF ke ODS dalam Python

  1. Buat instance objek Document dengan dokumen PDF sumber.
  2. Buat instance ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Simpan ke format ODS dengan memanggil metode save() dan meneruskannya ExcelSaveOptions.

Konversi ke format ODS dilakukan dengan cara yang sama seperti semua format lainnya.


    import aspose.pdf as ap
    
    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_ods.ods"
    # Buka dokumen PDF
    document = ap.Document(input_pdf)

    save_option = ap.ExcelSaveOptions()
    save_option.format = ap.ExcelSaveOptions.ExcelFormat.ODS

    # Simpan file
    document.save(output_pdf, save_option)

Lihat Juga

Artikel ini juga mencakup topik-topik ini. Kode-kode sama seperti di atas.

Format: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS