.NET에서 PDF를 Excel로 변환

개요

이 문서에서는 C#을 사용하여 PDF를 Excel 형식으로 변환하는 방법에 대해 설명합니다. 다음 주제를 다룹니다.

다음 코드 스니펫은 Aspose.PDF.Drawing 라이브러리에서도 작동합니다.

형식: XLS

형식: XLSX

형식: Excel

형식: 단일 Excel 워크시트

형식: XML 스프레드시트 2003 형식

형식: CSV

형식: ODS

C# PDF를 Excel로 변환

Aspose.PDF for .NET은 PDF 파일을 Excel 2007, CSV 및 SpeadsheetML 형식으로 변환하는 기능을 지원합니다. Aspose.PDF for .NET은 2007년 Excel, CSV 및 SpeadsheetML 형식으로 PDF 파일을 변환하는 기능을 지원합니다.

Aspose.PDF for .NET은 PDF 조작 컴포넌트로, PDF 파일을 Excel 워크북(XLSX 파일)으로 렌더링하는 기능을 도입했습니다. 이 변환 과정에서 PDF 파일의 개별 페이지가 Excel 워크시트로 변환됩니다.

PDF 파일을 XLSX 형식으로 변환하기 위해 Aspose.PDF는 ExcelSaveOptions라는 클래스를 가지고 있습니다. PDF 파일을 XLSX 형식으로 변환하기 위해 Aspose.PDF에는 ExcelSaveOptions라는 클래스가 있습니다.

다음 코드 스니펫은 Aspose.PDF for .NET을 사용하여 PDF 파일을 XLS 또는 XLSX 형식으로 변환하는 과정을 보여줍니다.

단계: C#에서 PDF를 XLS로 변환

  1. 소스 PDF 문서로 Document 객체의 인스턴스를 생성합니다.
  2. ExcelSaveOptions의 인스턴스를 생성합니다.
  3. Document.Save() 메서드를 호출하고 ExcelSaveOptions를 전달하여 .xls 확장자를 지정하여 XLS 형식으로 저장합니다.

단계: C#에서 PDF를 XLSX로 변환

  1. 소스 PDF 문서로 Document 객체의 인스턴스를 생성합니다.
  2. ExcelSaveOptions의 인스턴스를 생성합니다.
  3. Document.Save() 메서드를 호출하고 ExcelSaveOptions를 전달하여 .xlsx 확장자를 지정하여 XLSX 형식으로 저장합니다.
// PDF를 XLS로 변환하는 코드 예제
Document pdfDocument = new Document("input.pdf");
ExcelSaveOptions saveOptions = new ExcelSaveOptions();
pdfDocument.Save("output.xls", saveOptions);

// PDF를 XLSX로 변환하는 코드 예제
Document pdfDocument = new Document("input.pdf");
ExcelSaveOptions saveOptions = new ExcelSaveOptions();
pdfDocument.Save("output.xlsx", saveOptions);
// 완전한 예제와 데이터 파일은 https://github.com/aspose-pdf/Aspose.PDF-for-.NET 에서 확인하세요.
// 문서 디렉토리로의 경로입니다.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// PDF 문서를 로드합니다
Document pdfDocument = new Document(dataDir + "input.pdf");

// ExcelSave 옵션 객체를 인스턴스화합니다
Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions();

// 출력을 XLS 형식으로 저장합니다
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);

PDF를 XLS로 변환하면서 컨트롤 열

PDF를 XLS 형식으로 변환할 때 첫 번째 열로 빈 열이 출력 파일에 추가됩니다. ExcelSaveOptions 클래스의 InsertBlankColumnAtFirst 옵션을 사용하여 이 열을 제어할 수 있습니다. 기본값은 false이며, 이는 빈 열이 삽입되지 않음을 의미합니다.

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // 완전한 예제와 데이터 파일은 https://github.com/aspose-pdf/Aspose.PDF-for-.NET 에서 확인하세요.
    // PDF 문서를 로드합니다
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // ExcelSave 옵션 객체를 인스턴스화합니다
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // 출력을 XLS 형식으로 저장합니다
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

PDF를 단일 Excel 워크시트로 변환

PDF 파일을 XLS로 내보낼 때 많은 페이지가 각각 Excel 파일의 다른 시트로 내보내집니다. 기본적으로 MinimizeTheNumberOfWorksheets 속성이 false로 설정되어 있기 때문입니다. 출력 Excel 파일에서 모든 페이지를 하나의 시트로 내보내려면 MinimizeTheNumberOfWorksheets 속성을 true로 설정하세요.

단계: C#에서 PDF를 XLS 또는 XLSX 단일 워크시트로 변환

  1. 소스 PDF 문서를 사용하여 Document 객체의 인스턴스를 생성합니다.
  2. MinimizeTheNumberOfWorksheets = true를 가진 ExcelSaveOptions의 인스턴스를 생성합니다.
  3. Document.Save() 메소드를 호출하고 ExcelSaveOptions를 전달하여 단일 워크시트가 있는 XLS 또는 XLSX 형식으로 저장합니다.
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // 완전한 예제와 데이터 파일은 https://github.com/aspose-pdf/Aspose.PDF-for-.NET 에서 확인하십시오.
    // PDF 문서를 로드합니다.
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // ExcelSave Option 객체를 인스턴스화합니다.
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // 출력을 XLS 형식으로 저장합니다.
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

다른 스프레드시트 형식으로 변환

XML 스프레드시트 2003 형식으로 변환

버전 20.8부터 Aspose.PDF는 데이터 저장을 위해 기본적으로 Microsoft Excel Open XML 스프레드시트 2007 파일 형식을 사용합니다. PDF 파일을 XML 스프레드시트 2003 형식으로 변환하기 위해, Aspose.PDF는 ExcelSaveOptions 클래스를 Format와 함께 제공합니다. ExcelSaveOptions 클래스의 객체는 Document.Save(..) 메소드의 두 번째 인자로 전달됩니다.

다음 코드 스니펫은 PDF 파일을 XLS Excel 2003 XML 형식으로 변환하는 과정을 보여줍니다.

단계: C#에서 PDF를 Excel 2003 XML 형식으로 변환

  1. 소스 PDF 문서를 가진 Document 객체의 인스턴스를 생성합니다.
  2. XLS - Excel 2003 XML 포맷으로 저장하려면 Document.Save() 메소드를 호출하고 ExcelSaveOptions를 전달하세요.
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // 완전한 예제와 데이터 파일을 보려면 https://github.com/aspose-pdf/Aspose.PDF-for-.NET 방문하세요.

    // PDF 문서를 로드합니다
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // ExcelSave Option 객체 인스턴스 생성
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // 출력을 XLS 형식으로 저장합니다
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

CSV로 변환

CSV 형식으로의 변환은 위와 같은 방식으로 수행됩니다. 필요한 것은 적절한 형식을 설정하는 것입니다.

단계: C#에서 PDF를 CSV로 변환

  1. 원본 PDF 문서로 Document 객체의 인스턴스를 생성합니다.
  2. CSV 형식으로 저장하려면 Document.Save() 메소드를 호출하고 ExcelSaveOptions를 전달하십시오.
 // ExcelSave Option 객체를 인스턴스화합니다.
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

ODS로 변환

단계: C#에서 PDF를 ODS로 변환

  1. 소스 PDF 문서로 Document 객체의 인스턴스를 생성합니다.
  2. Format = ExcelSaveOptions.ExcelFormat.ODSExcelSaveOptions의 인스턴스를 생성합니다.
  3. Document.Save() 메소드를 호출하고 ExcelSaveOptions를 전달하여 ODS 형식으로 저장합니다.

ODS 형식으로의 변환은 다른 모든 형식과 동일한 방식으로 수행됩니다.

 // ExcelSave Option 객체를 인스턴스화합니다.
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

참고

이 문서는 위와 같은 코드를 사용하는 다음 주제들도 다룹니다.

형식: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS