.NETでPDFをExcelに変換
概要
この記事では、C#を使用してPDFをExcel形式に変換する方法について説明します。次のトピックをカバーしています。
次のコードスニペットも Aspose.PDF.Drawing ライブラリで動作します。
形式: XLS
形式: XLSX
フォーマット: Excel
フォーマット: シングルExcelワークシート
フォーマット: XMLスプレッドシート2003形式
フォーマット: CSV
フォーマット: ODS
C# PDFからExcelへの変換
Aspose.PDF for .NETはPDFファイルをExcel 2007、CSV、およびSpeadsheetML形式に変換する機能をサポートしています。 Aspose.PDF for .NET は、PDFファイルをExcel 2007、CSV、およびSpeadsheetML形式に変換する機能をサポートしています。
Aspose.PDF for .NETはPDF操作コンポーネントであり、PDFファイルをExcelワークブック(XLSXファイル)にレンダリングする機能を導入しました。この変換中に、PDFファイルの個々のページがExcelワークシートに変換されます。
PDFファイルをXLSX形式に変換するために、Aspose.PDFにはExcelSaveOptionsというクラスがあります。 PDFファイルをXLSX形式に変換するために、Aspose.PDFにはExcelSaveOptionsというクラスがあります。
以下のコードスニペットは、Aspose.PDF for .NETを使用してPDFファイルをXLSまたはXLSX形式に変換するプロセスを示しています。
- ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
- ExcelSaveOptionsのインスタンスを作成します。
- Document.Save() メソッドを呼び出し、ExcelSaveOptionsを渡すことで、.xls拡張子を指定してXLS形式で保存します。
- ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
- ExcelSaveOptionsのインスタンスを作成します。
- Document.Save() メソッドを呼び出し、ExcelSaveOptionsを渡すことで、.xlsx拡張子を指定してXLSX形式で保存します。
```csharp
// 完全な例やデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメントディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// PDFドキュメントを読み込む
Document pdfDocument = new Document(dataDir + "input.pdf");
// ExcelSave Option オブジェクトをインスタンス化する
Aspose.Pdf.ExcelSaveOptions excelsave = new Aspose.Pdf.ExcelSaveOptions();
// 出力をXLS形式で保存する
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
PDFをXLSに変換する際の制御列
PDFをXLS形式に変換するとき、出力ファイルの最初の列として空白の列が追加されます。これを制御するためにExcelSaveOptionsクラスのInsertBlankColumnAtFirstオプションを使用します。デフォルト値はfalse
で、これは空白の列が挿入されないことを意味します。
public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
// 完全な例やデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// PDFドキュメントを読み込む
Document pdfDocument = new Document(_dataDir + "input.pdf");
// ExcelSave Option オブジェクトをインスタンス化する
Aspose.Pdf.ExcelSaveOptions excelsave = new Aspose.Pdf.ExcelSaveOptions {InsertBlankColumnAtFirst = false};
// 出力をXLS形式で保存する
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}
PDFを単一のExcelワークシートに変換する
PDFファイルに多くのページが含まれている場合、XLSへのエクスポートでは、各ページがExcelファイルの異なるシートにエクスポートされます。これは、MinimizeTheNumberOfWorksheetsプロパティがデフォルトでfalseに設定されているためです。出力Excelファイルのすべてのページが1つのシートにエクスポートされるようにするには、MinimizeTheNumberOfWorksheetsプロパティをtrueに設定します。
手順: C#でPDFをXLSまたはXLSXの単一ワークシートに変換する
- ソースPDFドキュメントでDocumentオブジェクトのインスタンスを作成します。
- MinimizeTheNumberOfWorksheets = trueでExcelSaveOptionsのインスタンスを作成します。
- Document.Save()メソッドを呼び出し、ExcelSaveOptionsを渡すことで、単一ワークシートを持つXLSまたはXLSX形式で保存します。
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
// 完全な例とデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください
// PDFドキュメントをロード
Document pdfDocument = new Document(_dataDir + "input.pdf");
// ExcelSaveオプションオブジェクトのインスタンス化
Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
// 出力をXLS形式で保存
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}
他のスプレッドシート形式に変換する
XMLスプレッドシート2003形式に変換
バージョン20.8以降、Aspose.PDFはデータ格納のデフォルトとしてMicrosoft Excel Open XML Spreadsheet 2007ファイル形式を使用しています。PDFファイルをXMLスプレッドシート2003形式に変換するために、Aspose.PDFにはExcelSaveOptionsクラスがあり、Formatプロパティがあります。ExcelSaveOptionsクラスのオブジェクトをDocument.Save(..)メソッドの第二引数として渡します。
次のコードスニペットは、PDFファイルをXLS Excel 2003 XML形式に変換するプロセスを示しています。
手順: C#でPDFをExcel 2003 XML形式に変換する
- ソースPDFドキュメントを持つDocumentオブジェクトのインスタンスを作成します。
- Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡して XLS - Excel 2003 XML Format 形式で保存します。
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
// 完全な例とデータファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET をご覧ください
// PDF文書をロード
Document pdfDocument = new Document(_dataDir + "input.pdf");
// ExcelSave Option オブジェクトをインスタンス化
ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };
// 出力をXLS形式で保存
pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}
CSVへの変換
CSV形式への変換は上記と同じ方法で行います。必要なのは適切な形式を設定することです。
- ソースPDF文書を持つ Document オブジェクトのインスタンスを作成します。
CSV形式で保存する
Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡すことによって、CSV 形式で保存します。
// ExcelSaveオプションオブジェクトをインスタンス化
ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };
ODSへ変換
- ソースPDFドキュメントで Document オブジェクトのインスタンスを作成します。
- Format = ExcelSaveOptions.ExcelFormat.ODS で ExcelSaveOptions のインスタンスを作成します。
- Document.Save() メソッドを呼び出し、ExcelSaveOptions を渡して ODS 形式で保存します。
ODS形式への変換は、他のすべての形式と同じ方法で行います。
// ExcelSaveオプションオブジェクトをインスタンス化
ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };
参照
この記事では、上記と同じコードで以下のトピックもカバーしています。
フォーマット: Excel
- C# PDF to Excel Code
- C# PDF to Excel API
- C# PDFからExcelへのAPI
- C# プログラムでPDFからExcelへ
- C# PDFからExcelへのライブラリ
- C# PDFをExcelとして保存
- C# PDFからExcelを生成
- C# PDFからExcelを作成
- C# PDFからExcelへのコンバータ
Format: XLS
- C# PDFからXLSコード
- C# PDFからXLSへのAPI
- C# プログラムでPDFからXLSへ
- C# PDFからXLSへのライブラリ
- C# PDFをXLSとして保存
- C# PDFからXLSを生成
- C# PDFからXLSを作成
- C# PDFからXLSへのコンバータ
Format: XLSX
- C# PDFからXLSXコード
- C# PDFからXLSXへのAPI
- C# プログラムでPDFからXLSXへ
- C# PDFからXLSXへのライブラリ
- C# PDFをXLSXとして保存
- C# PDFからXLSXを生成
- C# PDFからXLSXを生成
- C# PDFからXLSXを作成
- C# PDFからXLSXへのコンバータ
Format: CSV
- C# PDFからCSVコード
- C# PDFからCSV API
- C# プログラムによるPDFからCSVへの変換
- C# PDFからCSVライブラリ
- C# PDFをCSVとして保存
- C# PDFからCSVを生成
- C# PDFからCSVを作成
- C# PDFからCSVへのコンバータ
Format: ODS