带有选择器的Node.js和Cheerio解析表

时间:2013-10-19 23:12:53

标签: javascript node.js html-parsing cheerio

我正在尝试使用Node.js和Cheerio解析HTML表格并得到一些结果但不幸的是我得到了太多的数据并且不确定如何进一步解析它以获得我需要的数据

这是我到目前为止的一小段代码..

var request = require("request");
var cheerio = require("cheerio");

request('http://www.myURL.com', function(error, response, body) {

  var $ = cheerio.load(body);

  $('td').each(function() {
    console.log($(this).text());

  });
});

使用Chrome插件找到选择器,我发现我需要“.clickableRow td”,但我尝试插入的方式似乎都不起作用。

为了更清晰一点,html源代码如下所示 -

<html>
 <body>
  <form>
   <table>
    <tbody>
     <td>
      <table class="standardTable">
       <tbody>
        <tr class="clickableRow">
         <td>first thing I want</td>
         <td>second thing I want</td>
         <td>third thing I want</td>
         <td>fourth thing I want</td>

这有意义吗?我想要的项目非常深入HTML,我不知道如何达到这个水平。任何帮助将不胜感激!谢谢!

1 个答案:

答案 0 :(得分:6)

只需使用选择器'.clickableRow td'