Extraer Tablas de PDF en Node.js

Extraer tablas al convertir archivos PDF a CSV

Convertir PDF a CSV

Si hay tablas en el PDF, entonces se guardan en archivos CSV separados. En caso de que desee convertir un documento PDF, puede usar la función AsposePdfTablesToCSV. Por favor, consulte el siguiente fragmento de código para convertir un archivo PDF en el entorno de Node.js.

CommonJS:

  1. Llame a require e importe el módulo asposepdfnodejs como variable AsposePdf.

  2. Especifique el nombre del archivo PDF que se convertirá.

  3. Llame a AsposePdf como Promise y realice la operación para convertir el archivo. Reciba el objeto si tiene éxito.

  4. Llame a la función AsposePdfTablesToCSV.

  5. Convierta el archivo PDF. Así, si ‘json.errorCode’ es 0, el resultado de la operación se guarda en “ResultPDFtoXlsX.xlsx”. Si el parámetro json.errorCode no es 0 y, en consecuencia, aparece un error en su archivo, la información del error se encontrará en ‘json.errorText’.


  const AsposePdf = require('asposepdfnodejs');
  const pdf_file = 'Aspose.pdf';
  AsposePdf().then(AsposePdfModule => {
      /*Convertir un archivo PDF a CSV (extraer tablas) con la plantilla "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número de página), TAB como delimitador y guardar*/
      const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
      console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
  });

ECMAScript/ES6:

  1. Importe el módulo asposepdfnodejs.

  2. Especifique el nombre del archivo PDF que se convertirá.

  3. Inicialice el módulo AsposePdf. Reciba el objeto si tiene éxito.

  4. Llame a la función AsposePdfTablesToCSV.

  5. Convierta el archivo PDF. Así, si ‘json.errorCode’ es 0, el resultado de la operación se guarda en “ResultPDFtoXlsX.xlsx”. Si el parámetro json.errorCode no es 0 y, en consecuencia, aparece un error en su archivo, la información del error se encontrará en ‘json.errorText’.


  import AsposePdf from 'asposepdfnodejs';
  const AsposePdfModule = await AsposePdf();
  const pdf_file = 'Aspose.pdf';
  /*Convertir un archivo PDF a CSV (extraer tablas) con la plantilla "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato del número de página), TAB como delimitador y guardar*/
  const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
  console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);