这是How to stop a loop when clicking asynchronously in CasperJS
的附加问题我试过这段代码
function execOnce(casper, i, max){
// end condition
if (i === max) {
return;
}
casper.wait(3000, function() {
var button = x('//*[@id="content"]/div[3]/a['+i+']');
if (!this.exists(button)) {
this.echo(i + " not available");
return;
}
this.thenClick(button, function (){
console.log('Searching dic');
words = words.concat(this.evaluate(getWords));
// recursive step
execOnce(this, i+1, max);
});
});
};
// start the recursive chain
casper.then(function(){
execOnce(this, 1, 200);
});
但我发现索引的目标网页的Xpath有迭代。
当它达到'//*[@id="mArticle"]/div[2]/a['11']'
时,下一个索引的Xpath变为'//*[@id="mArticle"]/div[2]/a['2']
(回到['2'])
例如,网页网址为“http://krdic.naver.com/search.nhn?query=%E3%85%8F%E3%85%8F&kind=keyword”
页面下方有[1][2][3][4][5][6][7][8][9][10] [Next Page]
当我点击下一页时,您可以看到
[Previous Page][11][12][13][14][15][16][17][18][19][20] [Next Page]
但[12]的Xpath不是//*[@id="content"]/div[3]/a[12]
--->它是
//*[@id="content"]/div[3]/a[2]
所以我必须进行function execOnce
的迭代,包括代码casper.wait(6000, function() {}
因为我的目标网站对查询非常敏感所以我随时都会“等待”代码..!
如果是这种情况,我可以使用这样的嵌套函数吗?
function execOnce(casper, i, max){
if (i === max) {
function execOnce(casper, i, max){
return;
}
...
答案 0 :(得分:1)
XPath非常富有表现力。例如,您可以根据链接文字而不是链接位置(//div[@class='paginate']/a[text()='5']
)选择目标网页链接,但在这种情况下,仅此一点对您没有帮助。
问题当然是该网站具有次要分页。您需要转到下一个分页页面,然后才能单击下一个分页链接。
casper.wait(3000, function() {
var nextButton = x('//*[@id="content"]/div[3]/a[text()="'+i+'"]');
var lastPageNextButton = '.paginate > strong + a.next';
var button = nextButton;
if (this.exists(lastPageNextButton)) {
button = lastPageNextButton;
} else if (!this.exists(button)) {
this.echo(i + " not available");
return;
}
this.thenClick(button, function (){
console.log('Searching dic');
words = words.concat(this.evaluate(getWords));
// recursive step
execOnce(this, i+1, max);
});
});