对于wget,在很多情况下它只是返回“将你的javascript转为继续”
我发现有些文章说使用Splash / PhantomJS可以渲染python的scrapy,但是即使使用python我也不熟悉编程,所以如果有一些可以与wget集成的解决方案,它将是完美的。感谢
答案 0 :(得分:2)
您不能仅使用wget
执行此操作。但你可以使用一个PhantomJS脚本:
$ phantomjs dl_page.js http://stackoverflow.com/questions > stackoverflow.html
<强> dl_page.js 强>:
const system = require('system');
const page = require('webpage').create();
page.open(system.args[1], function()
{
console.log(page.content);
phantom.exit();
});
答案 1 :(得分:0)
您可以使用Splash's HTTP API。
要获取呈现的HTML,请使用/render.html
endpoint,将URL作为参数传递,并可选择使用一些wait
参数:
wget -qO- 'http://localhost:8050/render.html?url=http://www.example.com/&timeout=10&wait=0.5'