用cherrio提取html元素

时间:2016-06-07 05:29:29

标签: html meteor cheerio

这个Meteor服务器代码使用cheerio并尝试提取文本'John',我尝试了以下几种不同的方式无效。
console.log(e.next.children.eq(1).text()); console.log(e.next.children.last().text()); console.log(e.next.contents().last().text());

如何用cheerio完成?感谢

ResObj.$("table").contents().filter(function() {
  return this.nodeType == 8;
}).each(function(i, e) {
  if (e.nodeValue.trim() == 'CONTACTS') {
    console.log(e.next.contents('td').eq(1).text()); //<----------
    console.log(e.nextSibling.nodeType);  // returns 3
  }
});


<!-- CONTACTS -->
<tr>
  <td class="label" valign="top" align="right" style="white-space:nowrap">
    Names of people:&nbsp;&nbsp;
  </td>
  <td class="displayValue" valign="top">

    John

  </td>
</tr>

1 个答案:

答案 0 :(得分:0)

Cheerio就像jQuery(大多数情况下),所以当你需要它时,为什么要构建这个复杂的结构:

$('table .displayValue').each(function () {
  console.log($(this).text());
});

让我们分解您的代码:

// Get all tables contents, then filter the data
ResObj.$("table").contents().filter(function() {
  // Only return Comments? https://developer.mozilla.org/en-US/docs/Web/API/Node/nodeType ... also you should be using ===
  return this.nodeType == 8;
// Loop through all of the filtered elements
}).each(function(i, e) {
  // Check the string of the comment for the text you want --- This is bad style
  if (e.nodeValue.trim() == 'CONTACTS') {
    console.log(e.next.contents('td').eq(1).text()); //<----------
    console.log(e.nextSibling.nodeType);  // returns 3
  }
});

他们为什么要经历所有这些循环的原因,只是为了得到一个容易访问的类的选择器?