Cheerio找到刮刮时无法找到的方法

时间:2013-12-08 19:25:01

标签: jquery node.js web-scraping cheerio

我正在使用以下代码

var request = require('request');
var cheerio = require('cheerio');
var url = "http://www.mbl.is/feeds/fp/";
request(url, function(err, resp, body) {
    if (err)
        throw err;
    $ = cheerio.load(body,{xmlMode : true});
    $('item').each(function(item, xmlItem){
        console.log($(xmlItem).find('title').text());
        console.log($(xmlItem).find('link').text());
        console.log($(xmlItem).children()[3]['children'][0]['data']);
    });
});

我的问题是,为什么.each循环中的第三行不能

console.log($(xmlItem).find('pubDate').text());

如果我使用该行,则输出为空,但下载的xml文件的结构告诉我不应该是这种情况。

1 个答案:

答案 0 :(得分:1)

重新配置添加lowerCaseTags标志的cheerio对象;

$ = cheerio.load(body, {
  xmlMode: true,
  lowerCaseTags: true
});

现在console.log($(xmlItem).find('pubDate').text());应该可以正常工作。