Converter PDF para Excel em .NET

Visão Geral

Este artigo explica como converter PDF para formatos Excel usando C#. Ele aborda os seguintes tópicos.

O seguinte trecho de código também funciona com a biblioteca Aspose.PDF.Drawing.

Formato: XLS

Formato: XLSX

Formato: Excel

Formato: Única Planilha de Excel

Formato: Formato de Planilha XML 2003

Formato: CSV

Formato: ODS

Conversões de PDF para Excel em C#

Aspose.PDF for .NET suporta a funcionalidade de converter arquivos PDF para os formatos Excel 2007, CSV e SpeadsheetML. Aspose.PDF para .NET suporta a funcionalidade de conversão de arquivos PDF para os formatos Excel 2007, CSV e SpeadsheetML.

Aspose.PDF para .NET é um componente de manipulação de PDF, introduzimos uma funcionalidade que renderiza arquivos PDF para a planilha do Excel (arquivos XLSX). Durante essa conversão, as páginas individuais do arquivo PDF são convertidas em planilhas do Excel.

Para converter arquivos PDF para o formato XLSX, Aspose.PDF possui uma classe chamada ExcelSaveOptions. Para converter arquivos PDF para o formato XLSX, o Aspose.PDF possui uma classe chamada ExcelSaveOptions.

O seguinte trecho de código mostra o processo de conversão de um arquivo PDF para o formato XLS ou XLSX com o Aspose.PDF para .NET.

Passos: Converter PDF para XLS em C#

  1. Crie uma instância do objeto Document com o documento PDF de origem.
  2. Crie uma instância de ExcelSaveOptions.
  3. Salve no formato XLS especificando a extensão .xls ao chamar o método Document.Save() e passando ExcelSaveOptions

Passos: Converter PDF para XLSX em C#

  1. Crie uma instância do objeto Document com o documento PDF de origem.
  2. Crie uma instância de ExcelSaveOptions.
  3. Salve no formato XLSX especificando a extensão .xlsx ao chamar o método Document.Save() e passando ExcelSaveOptions
// The code snippet remains the same in the translated document and should be included as provided initially.
// Para exemplos completos e arquivos de dados, por favor vá para https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Carregar documento PDF
Document pdfDocument = new Document(dataDir + "input.pdf");

// Instanciar objeto de opção de salvamento em Excel
Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions();

// Salvar a saída no formato XLS
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);

Converter PDF para XLS com Controle de Coluna

Ao converter um PDF para o formato XLS, uma coluna em branco é adicionada ao arquivo de saída como primeira coluna. A opção InsertBlankColumnAtFirst na classe ExcelSaveOptions é usada para controlar essa coluna. O valor padrão é false, o que significa que colunas em branco não serão inseridas.

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // Para exemplos completos e arquivos de dados, por favor vá para https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Carregar documento PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // Instanciar objeto de opção de salvamento em Excel
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // Salvar a saída no formato XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Converter PDF para uma única planilha do Excel

Ao exportar um arquivo PDF com várias páginas para XLS, cada página é exportada para uma diferente planilha no arquivo Excel. Isso ocorre porque a propriedade MinimizeTheNumberOfWorksheets está definida como false por padrão. Para garantir que todas as páginas sejam exportadas para uma única planilha no arquivo Excel final, defina a propriedade MinimizeTheNumberOfWorksheets como true.

Passos: Converter PDF para XLS ou XLSX em uma única planilha em C#

  1. Crie uma instância do objeto Document com o documento PDF de origem.
  2. Crie uma instância de ExcelSaveOptions com MinimizeTheNumberOfWorksheets = true.
  3. Salve no formato XLS ou XLSX tendo uma única planilha ao chamar o método Document.Save() e passando ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // Para exemplos completos e arquivos de dados, por favor, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Carregar o documento PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Instanciar objeto de opção de salvamento Excel
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // Salvar a saída no formato XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Converter para outros formatos de planilha

Converter para o formato XML Spreadsheet 2003

Desde a versão 20.8, o Aspose.PDF usa o formato de arquivo Microsoft Excel Open XML Spreadsheet 2007 como padrão para armazenar dados. Para converter arquivos PDF para o formato XML Spreadsheet 2003, o Aspose.PDF possui uma classe chamada ExcelSaveOptions com Format. Um objeto da classe ExcelSaveOptions é passado como segundo argumento para o método Document.Save(..).

O seguinte trecho de código mostra o processo para converter um arquivo PDF em formato XLS Excel 2003 XML.

Passos: Converter PDF para Formato XML Excel 2003 em C#

  1. Crie uma instância do objeto Document com o documento PDF de origem.
  2. Salve-o no formato XLS - Excel 2003 XML Format chamando o método Document.Save() e passando ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // Para exemplos completos e arquivos de dados, por favor, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET

    // Carregar documento PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Instanciar objeto de opções de salvamento Excel
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // Salvar a saída no formato XLS
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

Converter para CSV

A conversão para o formato CSV é realizada da mesma forma que acima. Tudo o que você precisa é definir o formato apropriado.

Passos: Converter PDF para CSV em C#

  1. Crie uma instância do objeto Document com o documento PDF de origem.
  2. Salve-o em formato CSV chamando o método Document.Save() e passando ExcelSaveOptions.
 // Instancie o objeto ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

Converter para ODS

Passos: Converter PDF para ODS em C#

  1. Crie uma instância do objeto Document com o documento PDF fonte.
  2. Crie uma instância de ExcelSaveOptions com Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Salve-o em formato ODS chamando o método Document.Save() e passando ExcelSaveOptions.

A conversão para o formato ODS é realizada da mesma maneira que todos os outros formatos.

 // Instancie o objeto ExcelSave Options
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

Veja Também

Este artigo também abrange estes tópicos. Os códigos são os mesmos que acima.

Formato: Excel

Formato: XLS

Formato: XLSX

Formato: CSV

Formato: ODS