pdf2json给我一个空白的输出txt文件?

时间:2016-06-10 21:56:08

标签: javascript node.js file pdf

我正在关注他们的"代码示例"指导他们的github。 https://github.com/modesty/pdf2json#code-example

在示例中说"解析PDF然后写一个.txt文件(只包含PDF的文本内容)",我将确切的实现复制并粘贴到我的本地JavaScript文件中调用它但输出文本文件完全空白。

<ItemsControl Name="images" >
    <ItemsControl.ItemTemplate>
        <DataTemplate>
            <Image Source="{Binding Link}" Stretch="None" ></Image>
        </DataTemplate>
    </ItemsControl.ItemTemplate>
    <ItemsControl.ItemsPanel>
        <ItemsPanelTemplate>
            <WrapPanel />
        </ItemsPanelTemplate>
    </ItemsControl.ItemsPanel>
</ItemsControl>

我做错了吗?或者这对他们不起作用?对于没有安装额外二进制文件的Nodejs的pdf到文本转换器,还有其他替代方法吗?

1 个答案:

答案 0 :(得分:4)

首页文档有点不对劲!为了使这项工作简单地设置为PDFParser参数null和1 <​​/ p>

这个有效:

var fs = require("fs");

// https://github.com/modesty/pdf2json
var PDFParser = require("./node_modules/pdf2json/PDFParser");
var pdfParser = new PDFParser(this,1);

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError));
pdfParser.on("pdfParser_dataReady", pdfData => {
    console.log(pdfParser)
    fs.writeFile("./content.txt", pdfParser.getRawTextContent());
});

HTH -XDVarpunen

链接到pdf2json中的问题:https://github.com/modesty/pdf2json/issues/76