PdfReader node.js

时间:2015-12-04 16:52:16

标签: node.js parsing pdf

我是NodeJS的新手。我试图用PdfReader解析PDF文件。假设我们有下一个代码序列:

    var PdfReader = require("pathto/PdfReader");

    aux = '';
    new PdfReader().parseFileItems(pdf_file, function(err, item) {
        if (err)
              callback(err);
        else if(item.text) 
              aux = item.text;
    });

    console.log(' aux = ' + aux);

让我们说最后一项是'汽车'。这意味着输出必须是'aux = car'。但我的输出是'aux ='。问题是在读取函数之外我无法看到在读取函数之前声明的变量的值。 有人可以向我解释发生了什么以及我必须做什么吗?

2 个答案:

答案 0 :(得分:0)

从你的代码中我假设parseFileItems是asynchonius函数(谷歌关于这个),你应该以这种方式记录结果:

` var PdfReader = require("pathto/PdfReader");

    aux = '';
    new PdfReader().parseFileItems(pdf_file, function(err, item) {
        if (err)
              callback(err);
        else if(item.text) 
        {
              aux = item.text;
              console.log(' aux = ' + aux);
        }

    });

    `

答案 1 :(得分:0)

您可以通过检查!项目检查文件结尾,然后打印上一个item.text。

var PdfReader = require("pathto/PdfReader");
aux = '';
new PdfReader().parseFileItems(pdf_file, function(err, item) {
    if (err)
          callback(err);
    else if(!item)
        console.log("aux + " + aux)
    else if(item.text)
          aux = item.text;       
});