似乎无法在Node.js中刮取div类标记

时间:2015-10-22 13:18:18

标签: node.js screen-scraping cheerio

我是node.js的新手。我的经验是Java和VBA。我试图为朋友抓一个网站,一切顺利,直到我无法得到我想要的东西。

<div class="gwt-Label ADC2X2-c-q ADC2X2-b-nb ADC2X2-b-Zb">Phone: +4576 102900</div>

该标签只有一个文字。没有attr或任何东西。但是我不能用cheerio来刮它。

if(!err && resp.statusCode == 200){

    var $ = cheerio.load(body);

    var number = $('//tried everything here!').text();
    console.log(number);

这个功能我也玩了

    $('.ADC2X2').filter(function(i){
        console.log("Sdfs");
        console.log (i);

任何建议都将不胜感激。

谢谢大家!

1 个答案:

答案 0 :(得分:1)

我从cheerio documentation获得答案。

agar.io

如果这不起作用,也许你的页面中有很多帧。 另一种可能性是页面是客户端的渲染器,如角度页面,因此搜索的元素不在服务器html中,而是仅在页面加载后创建。 如果这是真的,您将使用完整的浏览器,如phantomjs,而不仅仅是像cheerio这样的dom遍历工具。