搜寻网站内容的最佳选择是什么? 该网站位于Drupal7和PHP 5.5.9中。 我要在网页完全加载后抓取。
我知道有一些选项,例如PhantomJS和其他选项,但是用PhantomJS加载整个页面后,我无法获得内容。
我的PhantomJS脚本是这样的:
var page = new WebPage()
page.onLoadFinished = function() {
console.log(page.content);
phantom.exit();
};
page.open("https://www.mywebsite.com/", function() {
});
任何其他选项或具有PhantomJS脚本的人都可以在完全加载后抓取页面。