Конвертация PDF в Excel в .NET

Обзор

В данной статье объясняется, как конвертировать PDF в форматы Excel с использованием C#. Она охватывает следующие темы.

Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.

Формат: XLS

Формат: XLSX

Формат: Excel

Формат: Один лист Excel

Формат: XML Spreadsheet 2003

Формат: CSV

Формат: ODS

C# Конвертация PDF в Excel

Aspose.PDF for .NET поддерживает возможность конвертации PDF файлов в форматы Excel 2007, CSV и SpeadsheetML. Aspose.PDF для .NET поддерживает функцию конвертации PDF-файлов в форматы Excel 2007, CSV и SpeadsheetML.

Aspose.PDF для .NET — это компонент для манипуляции с PDF-файлами, мы представили функцию, которая рендерит PDF-файл в рабочую книгу Excel (файлы XLSX). Во время этой конвертации отдельные страницы PDF-файла конвертируются в листы Excel.

Для конвертации PDF-файлов в формат XLSX, Aspose.PDF имеет класс под названием ExcelSaveOptions. Для конвертации файлов PDF в формат XLSX, Aspose.PDF имеет класс под названием ExcelSaveOptions.

Следующий фрагмент кода показывает процесс преобразования файла PDF в формат XLS или XLSX с помощью Aspose.PDF для .NET.

Шаги: Конвертация PDF в XLS на C#

  1. Создайте экземпляр объекта Document с исходным документом PDF.
  2. Создайте экземпляр ExcelSaveOptions.
  3. Сохраните в формате XLS, указав .xls расширение, вызвав метод Document.Save() и передав ему ExcelSaveOptions

Шаги: Конвертация PDF в XLSX на C#

  1. Создайте экземпляр объекта Document с исходным документом PDF.
  2. Создайте экземпляр ExcelSaveOptions.
  3. Сохраните в формате XLSX, указав .xlsx расширение, вызвав метод Document.Save() и передав ему ExcelSaveOptions
```csharp
// Для полных примеров и файлов данных, пожалуйста, перейдите на https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Путь к директории с документами.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Загружаем PDF документ
Document pdfDocument = new Document(dataDir + "input.pdf");

// Создаем объект параметров сохранения в Excel
Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions();

// Сохраняем результат в формате XLS
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);

Конвертация PDF в XLS с контролем колонок

При конвертации PDF в формат XLS в выходной файл добавляется пустая колонка как первая колонка. В классе ExcelSaveOptions используется опция InsertBlankColumnAtFirst для контроля этой колонки. Значение по умолчанию false, что означает, что пустые колонки не будут вставлены.

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // Для полных примеров и файлов данных, пожалуйста, перейдите на https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Загружаем PDF документ
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // Создаем объект параметров сохранения в Excel
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // Сохраняем результат в формате XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Конвертация PDF в один лист Excel

При экспорте файла PDF с большим количеством страниц в XLS каждая страница экспортируется в отдельный лист файла Excel. Это связано с тем, что свойство MinimizeTheNumberOfWorksheets по умолчанию установлено в значение false. Чтобы все страницы были экспортированы в один лист в выходном файле Excel, установите свойство MinimizeTheNumberOfWorksheets в значение true.

Шаги: Конвертация PDF в XLS или XLSX один лист на C#

  1. Создайте экземпляр объекта Document с исходным документом PDF.
  2. Создайте экземпляр ExcelSaveOptions с MinimizeTheNumberOfWorksheets = true.
  3. Сохраните в формате XLS или XLSX с одним листом, вызвав метод Document.Save() и передав ему ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // Для полных примеров и файлов данных, пожалуйста, перейдите на https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Загрузите документ PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Создайте объект ExcelSave Option
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // Сохраните результат в формате XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Конвертация в другие форматы таблиц

Конвертация в формат XML Spreadsheet 2003

Начиная с версии 20.8, Aspose.PDF использует формат файла Microsoft Excel Open XML Spreadsheet 2007 в качестве стандартного для хранения данных. Для конвертации PDF файлов в формат XML Spreadsheet 2003, Aspose.PDF предоставляет класс ExcelSaveOptions с свойством Format. Объект класса ExcelSaveOptions передается в качестве второго аргумента методу Document.Save(..).

Приведенный ниже фрагмент кода показывает процесс конвертации PDF файла в формат XLS Excel 2003 XML.

Шаги: Конвертация PDF в формат Excel 2003 XML на C#

  1. Создайте экземпляр объекта Document с исходным PDF документом.
  2. Сохраните в формате XLS - Excel 2003 XML Format, вызвав метод Document.Save() и передав ему ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // Для полных примеров и файлов данных, пожалуйста, перейдите по ссылке https://github.com/aspose-pdf/Aspose.PDF-for-.NET

    // Загрузите PDF документ
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Создайте объект настроек сохранения Excel
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // Сохраните результат в формате XLS
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

Конвертировать в CSV

Конвертация в формат CSV производится таким же образом, как описано выше. Все, что вам нужно - это установить соответствующий формат.

Шаги: Конвертация PDF в CSV на C#

  1. Создайте экземпляр объекта Document с исходным PDF документом.
  2. Сохраните в формате CSV, вызвав метод Document.Save() и передав ему ExcelSaveOptions.
 // Создайте объект ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

Конвертировать в ODS

Шаги: Конвертация PDF в ODS в C#

  1. Создайте экземпляр объекта Document с исходным PDF-документом.
  2. Создайте экземпляр ExcelSaveOptions с Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Сохраните в формате ODS, вызвав метод Document.Save() и передав ему ExcelSaveOptions.

Конвертация в формат ODS выполняется так же, как и во всех других форматах.

 // Создайте объект ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

Смотрите также

В этой статье также рассматриваются следующие темы. Коды такие же, как выше.

Формат: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS