Mengonversi PDF ke Excel di .NET

Ikhtisar

Artikel ini menjelaskan bagaimana mengonversi PDF ke format Excel menggunakan C#. Ini mencakup topik berikut.

Potongan kode berikut juga bekerja dengan Aspose.PDF.Drawing library.

Format: XLS

Format: XLSX

Format: Excel

Format: Lembar Kerja Excel Tunggal

Format: Format Spreadsheet XML 2003

Format: CSV

Format: ODS

Konversi C# PDF ke Excel

Aspose.PDF for .NET mendukung fitur mengonversi file PDF ke format Excel 2007, CSV dan SpeadsheetML.

Aspose.PDF for .NET adalah komponen manipulasi PDF, kami telah memperkenalkan fitur yang merender file PDF ke workbook Excel (file XLSX). Selama konversi ini, halaman-halaman individu dari file PDF dikonversi menjadi lembar kerja Excel.

Untuk mengonversi file PDF ke format XLSX, Aspose.PDF memiliki kelas bernama ExcelSaveOptions. Sebuah objek dari kelas ExcelSaveOptions diteruskan sebagai argumen kedua ke konstruktor Document.Save(..).

Potongan kode berikut menunjukkan proses untuk mengonversi file PDF menjadi format XLS atau XLSX dengan Aspose.PDF for .NET.

Langkah: Mengonversi PDF ke XLS di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions.
  3. Simpan ke format XLS dengan menentukan .xls extension dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.

Langkah: Mengonversi PDF ke XLSX di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions.
  3. Simpan ke format XLSX dengan menentukan .xlsx extension dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.
  // For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
 private static void ConvertPDFtoExcel()
 {
     // The path to the documents directory
     var dataDir = RunExamples.GetDataDir_AsposePdf();

     // Open PDF document
     using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
     {
         // Instantiate ExcelSaveOptions object
         var saveOptions = new Aspose.Pdf.ExcelSaveOptions();

         // Save the file in XLSX format
         document.Save(dataDir + "PDFToXLS_out.xlsx", saveOptions);
     }
 }

Mengonversi PDF ke XLS dengan Kontrol Kolom

Saat mengonversi PDF ke format XLS, kolom kosong ditambahkan ke file output sebagai kolom pertama. Opsi InsertBlankColumnAtFirst dari kelas ExcelSaveOptions digunakan untuk mengontrol kolom ini. Nilai default adalah false, yang berarti kolom kosong tidak akan disisipkan.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
    {
        // Instantiate ExcelSaveOptions object
        var saveOptions = new Aspose.Pdf.ExcelSaveOptions
        {
            InsertBlankColumnAtFirst = false
        };

        // Save the file in XLSX format
        document.Save(dataDir + "PDFToXLS_out.xlsx", saveOptions);
    }
}

Mengonversi PDF ke Lembar Kerja Excel Tunggal

Saat mengekspor file PDF dengan banyak halaman ke XLS, setiap halaman diekspor ke lembar yang berbeda dalam file Excel. Ini karena properti MinimizeTheNumberOfWorksheets diatur ke false secara default. Untuk memastikan bahwa semua halaman diekspor ke satu lembar tunggal dalam file Excel output, atur properti MinimizeTheNumberOfWorksheets ke true.

Langkah: Mengonversi PDF ke XLS atau XLSX Lembar Kerja Tunggal di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan MinimizeTheNumberOfWorksheets = true.
  3. Simpan ke format XLS atau XLSX dengan memiliki lembar kerja tunggal dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.
 // For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
    {
        // Instantiate ExcelSaveOptions object
        var saveOptions = new Aspose.Pdf.ExcelSaveOptions
        {
            MinimizeTheNumberOfWorksheets = true
        };

        // Save the file in XLSX format
        document.Save(dataDir + "PDFToXLS_out.xlsx", saveOptions);
    }
}

Mengonversi ke format spreadsheet lainnya

Mengonversi ke format XML Spreadsheet 2003

Sejak versi 20.8 Aspose.PDF menggunakan format file Microsoft Excel Open XML Spreadsheet 2007 sebagai default untuk menyimpan data. Untuk mengonversi file PDF ke format XML Spreadsheet 2003, Aspose.PDF memiliki kelas bernama ExcelSaveOptions dengan Format. Sebuah objek dari kelas ExcelSaveOptions diteruskan sebagai argumen kedua ke metode Document.Save(..).

Potongan kode berikut menunjukkan proses untuk mengonversi file PDF menjadi format XLS Excel 2003 XML.

Langkah: Mengonversi PDF ke Format Excel 2003 XML di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003.
  3. Simpan ke format XLS - Format Excel 2003 XML dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.
  // For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
 private static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
 {
     // The path to the documents directory
     var dataDir = RunExamples.GetDataDir_AsposePdf();

     // Open PDF document
     using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
     {
         // Instantiate ExcelSaveOptions object
         var saveOptions = new Aspose.Pdf.ExcelSaveOptions
         {
             Format = Aspose.Pdf.ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003
         };

         // Save the file in XLS format
         document.Save(dataDir + "PDFToXLS_out.xls", saveOptions);
     }
 }

Mengonversi ke CSV

Konversi ke format CSV dilakukan dengan cara yang sama seperti di atas. Semua yang Anda butuhkan - atur format yang sesuai.

Langkah: Mengonversi PDF ke CSV di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.CSV.
  3. Simpan ke format CSV dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFToCSV()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
    {
        // Instantiate ExcelSaveOptions object
        var saveOptions = new Aspose.Pdf.ExcelSaveOptions
        {
            Format = Aspose.Pdf.ExcelSaveOptions.ExcelFormat.CSV
        };
        
        // Save the file in CSV format
        document.Save(dataDir + "PDFToXLS_out.csv", saveOptions);
    }
}

Mengonversi ke ODS

Langkah: Mengonversi PDF ke ODS di C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instance dari ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.ODS.
  3. Simpan ke format ODS dengan memanggil metode Document.Save() dan meneruskan ExcelSaveOptions.

Konversi ke format ODS dilakukan dengan cara yang sama seperti semua format lainnya.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ConvertPDFToODS()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf();
    
    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "input.pdf"))
    {
        // Instantiate ExcelSaveOptions object
        var saveOptions = new Aspose.Pdf.ExcelSaveOptions
        {
            Format = Aspose.Pdf.ExcelSaveOptions.ExcelFormat.ODS
        };

        // Save the file in ODS format
        document.Save(dataDir + "PDFToODS_out.ods", saveOptions);
    }
}

Lihat Juga

Artikel ini juga mencakup topik-topik ini. Kode sama seperti di atas.

Format: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS