我有一个PhantomJS / CasperJS脚本,我使用process.spawn()
在node.js脚本中运行。由于CasperJS不支持require()
模块,我正在尝试将命令从CasperJS打印到stdout
,然后使用spawn.stdout.on('data', function(data) {});
从我的node.js脚本中读取它们。比如将对象添加到redis / mongoose(复杂,是的,但似乎比为此设置Web服务更简单......)CasperJS脚本执行一系列命令并创建20个截图,需要添加到我的数据库。
但是,我无法弄清楚如何将data
变量(Buffer
?)分成几行......我已经尝试将其转换为字符串,然后进行替换,我尝试过做spawn.stdout.setEncoding('utf8');
,但似乎没有任何作用......
这就是我现在所拥有的
var spawn = require('child_process').spawn;
var bin = "casperjs"
//googlelinks.js is the example given at http://casperjs.org/#quickstart
var args = ['scripts/googlelinks.js'];
var cspr = spawn(bin, args);
//cspr.stdout.setEncoding('utf8');
cspr.stdout.on('data', function (data) {
var buff = new Buffer(data);
console.log("foo: " + buff.toString('utf8'));
});
cspr.stderr.on('data', function (data) {
data += '';
console.log(data.replace("\n", "\nstderr: "));
});
cspr.on('exit', function (code) {
console.log('child process exited with code ' + code);
process.exit(code);
});
答案 0 :(得分:14)
试试这个:
cspr.stdout.setEncoding('utf8');
cspr.stdout.on('data', function(data) {
var str = data.toString(), lines = str.split(/(\r?\n)/g);
for (var i=0; i<lines.length; i++) {
// Process the line, noting it might be incomplete.
}
});
请注意,“data”事件可能不一定在输出行之间均匀分布,因此单行可能跨越多个数据事件。
答案 1 :(得分:12)
我实际上是为了这个目的编写了一个Node库,它被称为流分割器,您可以在Github上找到它:samcday/stream-splitter。
库提供了一个特殊的Stream
,你可以将你的casper stdout连同一个分隔符(在你的情况下为\ n),它会发出整齐的token
事件,每行一个它已从输入Stream
中分离出来。这个内部实现非常简单,并将大部分魔法委托给substack/node-buffers,这意味着没有不必要的Buffer
分配/副本。
答案 2 :(得分:2)
添加到maerics的答案,这不能正确处理只有部分行被送入数据转储的情况(他们将分别给出行的第一部分和第二部分,作为两条单独的行。 )
var _breakOffFirstLine = /\r?\n/
function filterStdoutDataDumpsToTextLines(callback){ //returns a function that takes chunks of stdin data, aggregates it, and passes lines one by one through to callback, all as soon as it gets them.
var acc = ''
return function(data){
var splitted = data.toString().split(_breakOffFirstLine)
var inTactLines = splitted.slice(0, splitted.length-1)
var inTactLines[0] = acc+inTactLines[0] //if there was a partial, unended line in the previous dump, it is completed by the first section.
acc = splitted[splitted.length-1] //if there is a partial, unended line in this dump, store it to be completed by the next (we assume there will be a terminating newline at some point. This is, generally, a safe assumption.)
for(var i=0; i<inTactLines.length; ++i){
callback(inTactLines[i])
}
}
}
用法:
process.stdout.on('data', filterStdoutDataDumpsToTextLines(function(line){
//each time this inner function is called, you will be getting a single, complete line of the stdout ^^
}) )
答案 3 :(得分:1)
我发现了一个更好的方法,可以使用纯节点来执行此操作,这似乎很好:
const childProcess = require('child_process');
const readline = require('readline');
const cspr = childProcess.spawn(bin, args);
const rl = readline.createInterface({ input: cspr.stdout });
rl.on('line', line => /* handle line here */)
答案 4 :(得分:0)
你可以尝试一下。它将忽略任何空行或清空新换行符。
cspr.stdout.on('data', (data) => {
data = data.toString().split(/(\r?\n)/g);
data.forEach((item, index) => {
if (data[index] !== '\n' && data[index] !== '') {
console.log(data[index]);
}
});
});
答案 5 :(得分:0)