.NETでPDFをExcelに変換

概要

この記事では、C#を使用してPDFをExcel形式に変換する方法について説明します。次のトピックをカバーしています。

次のコードスニペットも Aspose.PDF.Drawing ライブラリで動作します。

形式: XLS

形式: XLSX

フォーマット: Excel

フォーマット: シングルExcelワークシート

フォーマット: XMLスプレッドシート2003形式

フォーマット: CSV

フォーマット: ODS

C# PDFからExcelへの変換

Aspose.PDF for .NETはPDFファイルをExcel 2007、CSV、およびSpeadsheetML形式に変換する機能をサポートしています。 Aspose.PDF for .NET は、PDFファイルをExcel 2007、CSV、およびSpeadsheetML形式に変換する機能をサポートしています。

Aspose.PDF for .NETはPDF操作コンポーネントであり、PDFファイルをExcelワークブック(XLSXファイル)にレンダリングする機能を導入しました。この変換中に、PDFファイルの個々のページがExcelワークシートに変換されます。

PDFファイルをXLSX形式に変換するために、Aspose.PDFにはExcelSaveOptionsというクラスがあります。 PDFファイルをXLSX形式に変換するために、Aspose.PDFにはExcelSaveOptionsというクラスがあります。

以下のコードスニペットは、Aspose.PDF for .NETを使用してPDFファイルをXLSまたはXLSX形式に変換するプロセスを示しています。

手順: C#でPDFをXLSに変換

  1. ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
  2. ExcelSaveOptionsのインスタンスを作成します。
  3. Document.Save() メソッドを呼び出し、ExcelSaveOptionsを渡すことで、.xls拡張子を指定してXLS形式で保存します。

手順: C#でPDFをXLSXに変換

  1. ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
  2. ExcelSaveOptionsのインスタンスを作成します。
  3. Document.Save() メソッドを呼び出し、ExcelSaveOptionsを渡すことで、.xlsx拡張子を指定してXLSX形式で保存します。
```csharp
// 完全な例やデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメントディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// PDFドキュメントを読み込む
Document pdfDocument = new Document(dataDir + "input.pdf");

// ExcelSave Option オブジェクトをインスタンス化する
Aspose.Pdf.ExcelSaveOptions excelsave = new Aspose.Pdf.ExcelSaveOptions();

// 出力をXLS形式で保存する
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);

PDFをXLSに変換する際の制御列

PDFをXLS形式に変換するとき、出力ファイルの最初の列として空白の列が追加されます。これを制御するためにExcelSaveOptionsクラスのInsertBlankColumnAtFirstオプションを使用します。デフォルト値はfalseで、これは空白の列が挿入されないことを意味します。

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // 完全な例やデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
    // PDFドキュメントを読み込む
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // ExcelSave Option オブジェクトをインスタンス化する
    Aspose.Pdf.ExcelSaveOptions excelsave = new Aspose.Pdf.ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // 出力をXLS形式で保存する
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

PDFを単一のExcelワークシートに変換する

PDFファイルに多くのページが含まれている場合、XLSへのエクスポートでは、各ページがExcelファイルの異なるシートにエクスポートされます。これは、MinimizeTheNumberOfWorksheetsプロパティがデフォルトでfalseに設定されているためです。出力Excelファイルのすべてのページが1つのシートにエクスポートされるようにするには、MinimizeTheNumberOfWorksheetsプロパティをtrueに設定します。

手順: C#でPDFをXLSまたはXLSXの単一ワークシートに変換する

  1. ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
  2. MinimizeTheNumberOfWorksheets = trueExcelSaveOptionsのインスタンスを作成します。
  3. Document.Save()メソッドを呼び出し、ExcelSaveOptionsを渡すことで、単一ワークシートを持つXLSまたはXLSX形式で保存します。
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // 完全な例とデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください
    // PDFドキュメントをロード
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // ExcelSaveオプションオブジェクトのインスタンス化
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // 出力をXLS形式で保存
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

他のスプレッドシート形式に変換する

XMLスプレッドシート2003形式に変換

バージョン20.8以降、Aspose.PDFはデータ格納のデフォルトとしてMicrosoft Excel Open XML Spreadsheet 2007ファイル形式を使用しています。PDFファイルをXMLスプレッドシート2003形式に変換するために、Aspose.PDFにはExcelSaveOptionsクラスがあり、Formatプロパティがあります。ExcelSaveOptionsクラスのオブジェクトをDocument.Save(..)メソッドの第二引数として渡します。

次のコードスニペットは、PDFファイルをXLS Excel 2003 XML形式に変換するプロセスを示しています。

手順: C#でPDFをExcel 2003 XML形式に変換する

  1. ソースPDFドキュメントを持つDocumentオブジェクトのインスタンスを作成します。
  2. Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡して XLS - Excel 2003 XML Format 形式で保存します。
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // 完全な例とデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET をご覧ください

    // PDF文書をロード
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // ExcelSave Option オブジェクトをインスタンス化
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // 出力をXLS形式で保存
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

CSVへの変換

CSV形式への変換は上記と同じ方法で行います。必要なのは適切な形式を設定することです。

手順: C#でPDFをCSVに変換

  1. ソースPDF文書を持つ Document オブジェクトのインスタンスを作成します。

CSV形式で保存する

Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡すことによって、CSV 形式で保存します。

 // ExcelSaveオプションオブジェクトをインスタンス化
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

ODSへ変換

手順: C#でPDFをODSに変換

  1. ソースPDFドキュメントで Document オブジェクトのインスタンスを作成します。
  2. Format = ExcelSaveOptions.ExcelFormat.ODSExcelSaveOptions のインスタンスを作成します。
  3. Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡して ODS 形式で保存します。

ODS形式への変換は、他のすべての形式と同じ方法で行います。

 // ExcelSaveオプションオブジェクトをインスタンス化
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

参照

この記事では、上記と同じコードで以下のトピックもカバーしています。

フォーマット: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS