Nodejs抓取选项

时间:2013-11-07 09:10:31

标签: html node.js scrape cheerio

我正在尝试在节点上为我的货币交换图构建一个抓取引擎,目前我正在使用request + cheerio,但由于某些银行网站不使用id / class'es html my code有时看起来像:

var eurcur = parsedHTML('p','body')
                               .eq(1).children('table')
                                .children('tr').eq(2)
                                 .children('td')
                                  .children('table')
                                   .children('tr').eq(10)
                                    .children('td').eq(4).text()

我能用的其他东西吗?

1 个答案:

答案 0 :(得分:1)

您可以将jsdom与功能齐全的JQuery一起使用。这允许您使用Cheerio不支持的更复杂的选择器,包括:first等选择器。

然而,你的一些.children电话(应该是可以合并的,例如

.children('td')
 .children('table')

.children('td > table')