使用正则表达式在Nodejs中查找下载的文件

时间:2017-02-01 21:54:45

标签: javascript regex node.js pdf

如果这是一个愚蠢的问题,请提前抱歉;我对节点js和javascript一般都很新。我已经开始使用pdf2json并使用他们的pdf-to-text示例将下载的pdf的信息存储在文本文件中。据我所知,该方法采用文件路径并解析pdf。除了下载文件的名称还包含下载日期(例如HealthReport-MM-DD-YYYY.pdf)之外,通常没问题。由于在路径(C:/Users/Me/Downloads/)中硬编码显然是一个坏主意,我希望有可能创建像pdf2json('/Downloads/'+/^HealthReport.*/g)这样的东西,以便解析正确的pdf文件,无论何时它被下载了。我将文本文件存储在临时文件夹中。

示例代码:

pdf2json('/Downloads/'+/^HealthReport.*/g)
pdf2json = function(filepath) {
    let fs = require('fs'),
        PDFParser = require("pdf2json");

    let pdfParser = new PDFParser(this,1);

    pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
    pdfParser.on("pdfParser_dataReady", pdfData => {
        fs.writeFile("/temp/HealthReport.content.txt", pdfParser.getRawTextContent());
    });

    pdfParser.loadPDF(filepath);
}

0 个答案:

没有答案