我想从下面给出的html中提取数据'AT401726'
<td class="publicationInfoColumn">
<h4>Publication info:</h4>
AT401726<br>2008-08-15
</td>
&安培;我通过使用JQuery解决了它,下面给出了工作代码
('body').find('.publicationInfoColumn').clone().children().remove().end().text()
还有其他更好的技术从上面给出的html中提取数据吗?在我的抓取的HTML页面中有很多像上面这样的HTML
答案 0 :(得分:1)
您正在寻找h4元素的下一个兄弟元素内容的文本,请尝试
var text = $.trim($('.publicationInfoColumn h4').prop('nextSibling').nodeValue);
console.log(text)
演示:Fiddle
答案 1 :(得分:0)
使用:
$('td.publicationInfoColumn').text();//for text
或
$('td.publicationInfoColumn').html();//for html
答案 2 :(得分:0)
你不能假设能够像这样定位特定的文本节点。你可以做的最好的是:
$('.publicationInfoColumn').html().match(/\b.*(?=<br>)/)