我想下载一个目录,并检查我在那里看到的每个文件的名称与正则表达式。基本上,只是用Node.js编写的公共unix find
命令的一个版本。我不关心文件的顺序,但我确实想确保我得到所有文件。
我有以下代码,这与我想要的很接近(我认为)。它需要一个startdir,一个正则表达式和一个回调;对于它分析的每个文件,它将sentinel
的值递增1,当它完成分析时,它会减少哨兵。我担心的是,如果有一个文件和一个深度嵌套的目录集合,它将分析该文件并在找到第二个文件之前很久就触发回调,并且可能会回调两次。
显然,我可以通过使用fired
变量来阻止回调被调用两次以限制它再次触发。但这仍然会给我错误的数据。我在这里做错了什么,是否有更适合节点的方法呢?
fs = require('fs')
path = require('path')
function get_all_files(startdir, regexp, callback) {
var sentinel = 0;
var results = [];
function check_sentinel() {
sentinel--;
if (sentinel === 0) {
callback(results);
}
}
function check_file(dir, filename) {
var fname;
sentinel++;
if (regexp.test(filename)) {
results.push(path.join(dir, filename));
}
check_sentinel();
}
function check_directory(dir) {
fs.readdir(path.join(this.rootpath, dirpath), function(err, files) {
var fname, i, len, npath;
if (err) {
throw err
}
for (i = 0, len = files.length; i < len; i++) {
fname = files[i];
npath = path.join(dir, fname);
fs.stat(npath, function(err, stats) {
if (stats.isFile()) {
check_file(dir, fname);
} else {
if (stats.isDirectory()) {
check_directory(npath);
}
}
});
}
});
}
check_directory(startdir);
}
答案 0 :(得分:1)
有几点想法......
我从未使用过它,但最简单的方法就是使用async.js walkfiles函数。请参阅tests for an example here。
否则,我会考虑构建一个函数调用数组并从递归目录walk函数返回数组(而不是使用sentinel等)。换句话说,check_directory返回与您要查找的文件匹配的函数调用数组。如果没有文件,则该数组为空。
最后,将数组组合在递归的顶部,并使用async库(与async.js不同)使用parallel函数一次执行所有函数数组( see this thread for an example using "series")。