好吧,我需要使用循环使用horseman点击许多链接。 例如 HTML文件:
<ul class="conn-list">
<li><a> link 1 </a></li>
<li><a> link 2 </a></li>
<li><a> link 3 </a></li>
</ul>
我已经尝试过这样的事情(.js文件[使用node.js]):
var Horseman = require("node-horseman");
var horseman = new Horseman();
var $ = require ("jquery");
horseman.viewport(3200, 1800)
.open('url')
/* some code to navigate the headless browser*/
.evaluate(function clickLinks() {
var $links = $("a"); //I am supposing that are not other <a> tags on the page.
$links.each(function (index, $links) {
$(this).click();
horseman.waitForNextPage()
.wait(5000) //just to ensure that all the page loads before the print.
.screenshot("new_page", index, ".png") //just to know if it works.
});
})
这就是全部,它编译但不采取scheenshots既不访问超链接..我不知道,也许答案是使用来自horseman.js的多个选项卡支持..任何帮助欢迎新手! :D谢谢你的时间!
答案 0 :(得分:0)
Horseman的.evaluate()
方法接受一个函数,然后将其转换为字符串并注入页面。这意味着该函数不知道它之外的任何内容(e.x. horseman
)。
您将收到包含以下内容的无用错误:
global code
evaluateJavaScript@[native code]
您希望在传递给.evaluate(fn)
的函数中返回链接的网址,将这些网址带回节点进程并在那里循环显示。
因为Horseman是建立在Bluebird承诺库之上的,所以您只需拨打.then()
即可。所以,像这样:
horseman.viewport(3200, 1800)
.open('url')
.evaluate(function clickLinks() {
var $links = $("a"); //I am supposing that are not other <a> tags on the page.
return $links.map(function (index, $links) {
return $(this).attr('href');
}).get();
})
.then(async function (hrefs){
// this uses async/await, but you can use some recursive function or some other async looping logic
for(var href of hrefs) {
// use the .open() method with the gathered href's
await horseman.open(href)
.wait(5000) //just to ensure that all the page loads before the print.
.screenshot("new_page", index, ".png") //just to know if it works.
}
})