Ekstraksi Tabel dari PDF di Node.js
Ekstraksi tabel saat mengonversi PDF ke file CSV
Konversi PDF ke CSV
Jika ada tabel dalam PDF maka mereka akan disimpan dalam file CSV terpisah. Jika Anda ingin mengonversi dokumen PDF, Anda dapat menggunakan fungsi AsposePdfTablesToCSV. Silakan periksa cuplikan kode berikut untuk mengonversi file PDF di lingkungan Node.js.
CommonJS:
-
Panggil
require
dan impor modulasposepdfnodejs
sebagai variabelAsposePdf
. -
Tentukan nama file PDF yang akan dikonversi.
-
Panggil
AsposePdf
sebagai Promise dan lakukan operasi untuk mengonversi file. Terima objek jika berhasil. -
Panggil fungsi AsposePdfTablesToCSV.
-
Konversi file PDF. Jadi, jika ‘json.errorCode’ adalah 0, hasil operasi disimpan dalam “ResultPDFtoXlsX.xlsx”. Jika parameter json.errorCode bukan 0 dan, sesuai dengan itu, muncul kesalahan dalam file Anda, informasi kesalahan akan terkandung dalam ‘json.errorText’.
const AsposePdf = require('asposepdfnodejs');
const pdf_file = 'Aspose.pdf';
AsposePdf().then(AsposePdfModule => {
/*Mengonversi file PDF ke CSV (ekstrak tabel) dengan template "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... format nomor halaman), TAB sebagai pembatas, dan simpan*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
});
ECMAScript/ES6:
-
Impor modul
asposepdfnodejs
. -
Tentukan nama file PDF yang akan dikonversi.
-
Inisialisasi modul AsposePdf. Terima objek jika berhasil.
-
Panggil fungsi AsposePdfTablesToCSV.
-
Konversi file PDF. Dengan demikian, jika ‘json.errorCode’ adalah 0, hasil operasi disimpan dalam “ResultPDFtoXlsX.xlsx”. Jika parameter json.errorCode tidak 0 dan, sesuai, muncul kesalahan dalam file Anda, informasi kesalahan akan terdapat dalam ‘json.errorText’.
import AsposePdf from 'asposepdfnodejs';
const AsposePdfModule = await AsposePdf();
const pdf_file = 'Aspose.pdf';
/*Konversi file PDF ke CSV (ekstrak tabel) dengan template "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... format nomor halaman), TAB sebagai pemisah dan simpan*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);