如何使用phantomJS在动态网页上抓取特定数据?

时间:2017-04-04 02:05:00

标签: javascript web-scraping phantomjs web-crawler

我知道我在问一个非常普遍的问题,但我真的很喜欢javascript和phantomJS。我正在尝试构建一个Web爬网程序来抓取网页上的特定信息。

现在我的代码看起来像这样,它给了我页面上的所有内容。

var page = require('webpage').create();

    page.open ('https://www.lennar.com/new-homes/washington/seattle', function(status) {
      console.log("status: " + status);

      if (status === "success"){
      //  page.render('example.png');
        console.log(page.plainText);
      }
      phantom.exit();
    });

现在它给了我一切,但我想要这个页面上的粗体字 https://www.lennar.com/new-homes/washington/seattle

如果您点击打开链接 我想抓住带位置的粗体黑字 所以基本上我想打印: 广州高地

广州公园南 广东岭 克里斯蒂的穿越 鹰格伦 .....

我真的很无能为力。任何建议都会有所帮助吗?我应该从哪里开始看?

0 个答案:

没有答案