我知道我在问一个非常普遍的问题,但我真的很喜欢javascript和phantomJS。我正在尝试构建一个Web爬网程序来抓取网页上的特定信息。
现在我的代码看起来像这样,它给了我页面上的所有内容。
var page = require('webpage').create();
page.open ('https://www.lennar.com/new-homes/washington/seattle', function(status) {
console.log("status: " + status);
if (status === "success"){
// page.render('example.png');
console.log(page.plainText);
}
phantom.exit();
});
现在它给了我一切,但我想要这个页面上的粗体字 https://www.lennar.com/new-homes/washington/seattle
如果您点击打开链接 我想抓住带位置的粗体黑字 所以基本上我想打印: 广州高地
广州公园南 广东岭 克里斯蒂的穿越 鹰格伦 .....
我真的很无能为力。任何建议都会有所帮助吗?我应该从哪里开始看?