Node.js:你什么时候知道异步任务的集合何时完成?

时间:2011-08-02 05:10:29

标签: asynchronous node.js

我想下载一个目录,并检查我在那里看到的每个文件的名称与正则表达式。基本上,只是用Node.js编写的公共unix find命令的一个版本。我不关心文件的顺序,但我确实想确保我得到所有文件。

我有以下代码,这与我想要的很接近(我认为)。它需要一个startdir,一个正则表达式和一个回调;对于它分析的每个文件,它将sentinel的值递增1,当它完成分析时,它会减少哨兵。我担心的是,如果有一个文件和一个深度嵌套的目录集合,它将分析该文件并在找到第二个文件之前很久就触发回调,并且可能会回调两次。

显然,我可以通过使用fired变量来阻止回调被调用两次以限制它再次触发。但这仍然会给我错误的数据。我在这里做错了什么,是否有更适合节点的方法呢?

fs = require('fs')
path = require('path')

function get_all_files(startdir, regexp, callback) {
    var sentinel = 0;
    var results = [];

    function check_sentinel() {
        sentinel--;
        if (sentinel === 0) {
            callback(results);
        }
    }

    function check_file(dir, filename) {
        var fname;
        sentinel++;
        if (regexp.test(filename)) {
            results.push(path.join(dir, filename));
        }
        check_sentinel();
    }

    function check_directory(dir) {
        fs.readdir(path.join(this.rootpath, dirpath), function(err, files) {
            var fname, i, len, npath;
            if (err) {
                throw err
            }

            for (i = 0, len = files.length; i < len; i++) {
                fname = files[i];
                npath = path.join(dir, fname);
                fs.stat(npath, function(err, stats) {
                    if (stats.isFile()) {
                        check_file(dir, fname);
                    } else {
                        if (stats.isDirectory()) {
                            check_directory(npath);
                        }
                    }
                });
            }
        });
    }
    check_directory(startdir);
}

1 个答案:

答案 0 :(得分:1)

有几点想法......

我从未使用过它,但最简单的方法就是使用async.js walkfiles函数。请参阅tests for an example here

否则,我会考虑构建一个函数调用数组并从递归目录walk函数返回数组(而不是使用sentinel等)。换句话说,check_directory返回与您要查找的文件匹配的函数调用数组。如果没有文件,则该数组为空。

最后,将数组组合在递归的顶部,并使用async库(与async.js不同)使用parallel函数一次执行所有函数数组( see this thread for an example using "series")。