使用cheerio,Scraper不使用jquery返回任何值

时间:2015-10-06 22:04:43

标签: javascript jquery node.js web-scraping cheerio

尝试抓取网站的首页(www.ozbargain.com)以返回包含对xbox的引用的标记中的任何内容,但没有任何内容返回到控制台。我认为问题在于if语句:contains。

var fs = require('fs'),
    request = require('request'),
    cheerio = require('cheerio');

url = 'http://www.ozbargain.com.au';

request(url, function(error, response, html) {
  if (!error && response.statusCode == 200) {
    var $ = cheerio.load(html);
    if($("a:contains('Xbox')").length) {
      //console.log(this);
      var el = $(this);
      var log = el.text();
      console.log(log);
    } else {
      console.log('hey');
    }
  }
});

我之后的html块。特别是,我想要一个标签;

<h2 class="title" id="title214252"><a href="/node/214252">Free on Xbox One, Xbox 360, PS3, PS4: Tales from the Borderlands (Episode 1)</a></h2>

2 个答案:

答案 0 :(得分:0)

包含的Cheerio语法与jQuery略有不同。请忽略您正在搜索的字符串周围的单引号:

$("a:contains(Xbox)")

答案 1 :(得分:0)

将选择器分配给变量,然后调用文本方法。

request(url, function(error, response, html) {
    if (!error && response.statusCode == 200) {
        var $ = cheerio.load(html);
        var $el = $("a:contains('Xbox')");

        if ($el.length) {
            console.log($el.text());
        } else {
            console.log('hey');
        }
    }
});