Ekstrak Teks dari PDF di Node.js
Contents
[
Hide
]
Ekstrak Teks Dari Dokumen PDF
Mengekstrak teks dari dokumen PDF adalah tugas yang sangat umum dan berguna. Mengekstrak teks dari PDF melayani berbagai tujuan, mulai dari meningkatkan pencarian dan ketersediaan hingga memungkinkan analisis dan otomatisasi data di berbagai bidang seperti bisnis, penelitian, dan manajemen informasi.
Jika Anda ingin mengekstrak teks dari dokumen PDF, Anda dapat menggunakan fungsi AsposePdfExtractText. Silakan periksa potongan kode berikut untuk mengekstrak teks dari file PDF menggunakan Node.js via C++.
Periksa potongan kode dan ikuti langkah-langkah untuk mengekstrak teks dari PDF Anda:
CommonJS:
- Panggil
require
dan impor modulasposepdfnodejs
sebagai variabelAsposePdf
. - Tentukan nama untuk file PDF dari mana teks akan diekstraksi.
- Panggil
AsposePdf
sebagai Promise dan lakukan operasi untuk mengekstraksi teks. Terima objek jika berhasil. - Panggil fungsi AsposePdfExtractText.
- Teks yang diekstraksi disimpan dalam objek JSON. Jadi, jika ‘json.errorCode’ adalah 0, teks yang diekstraksi ditampilkan menggunakan console.log. Jika parameter json.errorCode bukan 0 dan, oleh karena itu, muncul kesalahan dalam file Anda, informasi kesalahan akan terkandung dalam ‘json.errorText’.
const AsposePdf = require('asposepdfnodejs');
const pdf_file = 'Aspose.pdf';
AsposePdf().then(AsposePdfModule => {
/*Ekstrak teks dari file PDF*/
const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});
ECMAScript/ES6:
- Impor modul
asposepdfnodejs
. - Tentukan nama untuk file PDF dari mana teks akan diekstraksi.
- Inisialisasi modul AsposePdf. Terima objek jika berhasil.
- Panggil fungsi AsposePdfExtractText.
- Teks yang diekstraksi disimpan dalam objek JSON. Jadi, jika ‘json.errorCode’ adalah 0, teks yang diekstraksi akan ditampilkan menggunakan console.log. Jika parameter json.errorCode bukan 0 dan, sesuai, muncul kesalahan dalam file Anda, informasi kesalahan akan terdapat dalam ‘json.errorText’.
import AsposePdf from 'asposepdfnodejs';
const AsposePdfModule = await AsposePdf();
const pdf_file = 'Aspose.pdf';
/*Ekstrak teks dari file PDF*/
const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);