在采取行动之前等待文件完成复制?

时间:2014-01-08 15:05:09

标签: node.js

我有一个简单的node.js应用程序,它可以监视新PDF文件的目录。当它看到它们出现时,将它们FTP并将它们移动到另一个目录。

我遇到的问题是,如果文件有点大(例如10MB),我的应用程序会在完成复制到目录之前开始处理文件。

副本通过网络发生,因此可以减慢速度。我需要一种方法告诉我的应用程序等到文件完成复制后才能处理它。

最好的方法是什么?我已经尝试了'grow-file'模块,但它似乎不起作用,看起来开发人员已经放弃了它。

提前感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

我遇到了几乎相同的问题,我需要在播放之前下载文件。我最终编写了这段代码,您可以轻松地为您的操作重写代码。

编辑:事实上,你几乎可以使用代码as-if,只需要小心下载的回调。

它利用回调逐个下载每个文件(我有带宽问题),但是我有一个以前的版本开始全部下载,然后在回调之前等待所有文件都在磁盘上。

你需要有一个名为DOWNLOAD_DIR的全局变量,它包含下载目录的完整路径,如果你想用它作为它。

你还需要http,但我认为你已经拥有了它。

var http = require('http');

/*download
IN_: file_url
        string
        url of the file to download
     callback
COM: Download the specified file to DOWNLOAD_DIR/name_of_the_file, and callback the full path to the file
     callback null on error.
*/
function download(file_url, callback) {
    var options = {
        host: url.parse(file_url).host,
        port: 80,
        path: url.parse(file_url).pathname
    },
        file_name = url.parse(file_url).pathname.split('/').pop(),
    //Creating the file
        file = fs.createWriteStream(DOWNLOAD_DIR + file_name, {flags: 'w', encoding: 'binary'}),
    console.log('Downloading file from ' + file_url);
    console.log(LOG, '\tto ' + file_name);
    http.get(options, function (res) {
        res.pipe(file, {end: 'false'});
        //When the file is complete
        res.on('end', function () {
            //Closing the file
            file.end();
            console.log(LOG, '\t\tDownloaded '+ file_name);
            callback(DOWNLOAD_DIR + file_name);
        });
    });

    process.on('uncaughtException', function(err) {
        console.log('Can t download ' + file_url + '\t(' + err + ')');
        callback(null);
    });

}

/*download_all
IN_: list
        array of string
        Names of the files to download
     callback
COM: Download all the file one after another
*/
function download_all(list, callback) {
    var i = 0, 
        fe;

    function follow() {
        //If there is download to do
        if (i < list.length) {
            //Checking if the file already exist
            fe = fs.existsSync(DOWNLOAD_DIR + list[i].substr(list[i].lastIndexOf('/')));
            console.log('Checking ' + list[i]);
            if (!fe) {
                console.log('\tDo not exist');
                //If it doesn t, downloading it
                download(list[i], function () {
                    i = i + 1;
                    //And go to the next file
                    follow();
                });
            } else {
                //If it does, go to the next file
                console.log('\tExist');
                i = i + 1;
                follow();
            }
        } else {
            //When all files are downloaded
            console.log('end');
            callback();
        }
    }
    follow();
}

请注意,在生产代码中,您应该通过fs.exist + callback替换fs.existSync(在下载中)

编辑:这里是一次火下载的代码。请注意,这是我编辑过的旧代码。

请注意,此代码很旧,我没有对它进行过多次测试,并且也使用了fs.existSync(这对于生产代码来说也是如此)。

最后请注意,如果下载失败,下载的回调将有null参数,您必须自己检查。

/*download_all
IN_: list
        array of string
        Names of the files to download
     callback
COM: Download all-at-once
*/
function download_all(list, callback){
    var i=0, dltd, dlcp=0;
    dltd=list.length;

    function afterDownload(){
        dlcp=dlcp+1;
        console.log("Telechargement fini:"+dlcp);
        if(dlcp===dltd){
            callback();
        }
    }

    while(i<list.length)
    {
        if(!fs.existsSync(DOWNLOAD_DIR + list[i].substr(list[i].lastIndexOf('/'))))
        {
            //If the file do not exist
            download(list[i], afterDownload);
        } else {
            afterDownload();
        }
        i=i+1;
    }
}

示例:

var http = require('http'),
    DOWNLOAD_DIR = '/home/user/download/',
    list = ['http://somewebsite.com/video.mp4', 'http://somewebsite.com/video2.mp4', 'http://othersite.com/image.png'];

download_all(list, function (){
    //Do stuff
});