如何使用jquery提取子文本数据?

时间:2014-02-01 10:14:14

标签: javascript jquery html web-crawler phpquery

我想从下面给出的html中提取数据'AT401726'

<td class="publicationInfoColumn">
  <h4>Publication info:</h4>
  AT401726<br>2008-08-15
</td>

&安培;我通过使用JQuery解决了它,下面给出了工作代码

('body').find('.publicationInfoColumn').clone().children().remove().end().text()

还有其他更好的技术从上面给出的html中提取数据吗?在我的抓取的HTML页面中有很多像上面这样的HTML

3 个答案:

答案 0 :(得分:1)

您正在寻找h4元素的下一个兄弟元素内容的文本,请尝试

var text = $.trim($('.publicationInfoColumn h4').prop('nextSibling').nodeValue);
console.log(text)

演示:Fiddle

答案 1 :(得分:0)

使用:

$('td.publicationInfoColumn').text();//for text

$('td.publicationInfoColumn').html();//for html

答案 2 :(得分:0)

你不能假设能够像这样定位特定的文本节点。你可以做的最好的是:

$('.publicationInfoColumn').html().match(/\b.*(?=<br>)/)