Question

如果这是一个愚蠢的问题，请提前抱歉;我对节点js和javascript一般都很新。我已经开始使用pdf2json并使用他们的pdf-to-text示例将下载的pdf的信息存储在文本文件中。据我所知，该方法采用文件路径并解析pdf。除了下载文件的名称还包含下载日期（例如HealthReport-MM-DD-YYYY.pdf）之外，通常没问题。由于在路径（C:/Users/Me/Downloads/）中硬编码显然是一个坏主意，我希望有可能创建像pdf2json('/Downloads/'+/^HealthReport.*/g)这样的东西，以便解析正确的pdf文件，无论何时它被下载了。我将文本文件存储在临时文件夹中。

示例代码：

pdf2json('/Downloads/'+/^HealthReport.*/g)
pdf2json = function(filepath) {
    let fs = require('fs'),
        PDFParser = require("pdf2json");

    let pdfParser = new PDFParser(this,1);

    pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
    pdfParser.on("pdfParser_dataReady", pdfData => {
        fs.writeFile("/temp/HealthReport.content.txt", pdfParser.getRawTextContent());
    });

    pdfParser.loadPDF(filepath);
}

使用正则表达式在Nodejs中查找下载的文件

0 个答案: