Extraer Tablas de PDF en Node.js
Extraer tablas al convertir archivos PDF a CSV
Convertir PDF a CSV
Si hay tablas en el PDF, entonces se guardan en archivos CSV separados. En caso de que desee convertir un documento PDF, puede usar la función AsposePdfTablesToCSV. Por favor, consulte el siguiente fragmento de código para convertir un archivo PDF en el entorno de Node.js.
CommonJS:
-
Llame a
require
e importe el móduloasposepdfnodejs
como variableAsposePdf
. -
Especifique el nombre del archivo PDF que se convertirá.
-
Llame a
AsposePdf
como Promise y realice la operación para convertir el archivo. Reciba el objeto si tiene éxito. -
Llame a la función AsposePdfTablesToCSV.
-
Convierta el archivo PDF. Así, si ‘json.errorCode’ es 0, el resultado de la operación se guarda en “ResultPDFtoXlsX.xlsx”. Si el parámetro json.errorCode no es 0 y, en consecuencia, aparece un error en su archivo, la información del error se encontrará en ‘json.errorText’.
const AsposePdf = require('asposepdfnodejs');
const pdf_file = 'Aspose.pdf';
AsposePdf().then(AsposePdfModule => {
/*Convertir un archivo PDF a CSV (extraer tablas) con la plantilla "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número de página), TAB como delimitador y guardar*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
});
ECMAScript/ES6:
-
Importe el módulo
asposepdfnodejs
. -
Especifique el nombre del archivo PDF que se convertirá.
-
Inicialice el módulo AsposePdf. Reciba el objeto si tiene éxito.
-
Llame a la función AsposePdfTablesToCSV.
-
Convierta el archivo PDF. Así, si ‘json.errorCode’ es 0, el resultado de la operación se guarda en “ResultPDFtoXlsX.xlsx”. Si el parámetro json.errorCode no es 0 y, en consecuencia, aparece un error en su archivo, la información del error se encontrará en ‘json.errorText’.
import AsposePdf from 'asposepdfnodejs';
const AsposePdfModule = await AsposePdf();
const pdf_file = 'Aspose.pdf';
/*Convertir un archivo PDF a CSV (extraer tablas) con la plantilla "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato del número de página), TAB como delimitador y guardar*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);