如何使用Node.js读取PDF中的不同语言字体

时间:2018-10-19 10:26:40

标签: node.js mean-stack pdf-reader

我在我的应用程序中将nodejs用作服务器。我已经使用pdfreader和pdfjson npm模块读取pdf文件。

我的代码如下所示:

let fs = require('fs'),
PDFParser = require("pdf2json");
let pdfParser = new PDFParser();

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
    fs.writeFile("./pdf2json/test/F1040EZ.json", JSON.stringify(pdfData));
});

pdfParser.loadPDF("./sample.pdf");

我已正确读取文件。现在,我对包含不同语言文件的文件感到震惊。我的文件可能包含日语和印度语,如印地语,泰米尔语和泰卢固语。

解析后我没有得到其他语言。如何阅读其他语言并写入另一个文件?

0 个答案:

没有答案