如何从动态HTML标记中获取文本

时间:2016-02-02 10:09:58

标签: c# html web-crawler

如何从以下html脚本中仅提取ARTS 003。在以下脚本<a href= *** target="_blank">ARTS 003</a>中,***是动态部分,可以从一个页面更改为另一个页面。仅供参考,我有一些HTML页面。

<a href="preview_course_nopop.php?catoid=2&coid=1380" onclick="acalogPopup('preview_course.php?catoid=2&coid=1380&print', '3', 770, 530, 'yes');return false;" rel="remote /ajax/preview_course.php?catoid=2&coid=1380&display_options[location]=tooltip&show" id="tt2379" target="_blank">ARTS 003</a>

提前致谢。

2 个答案:

答案 0 :(得分:0)

使用纯JavaScript检查此解决方案。

https://jsfiddle.net/ay284ktk/

    <a id="mylink" href="preview_course_nopop.php?catoid=2&coid=1380" onclick="acalogPopup('preview_course.php?catoid=2&coid=1380&print', '3', 770, 530, 'yes');return false;" rel="remote /ajax/preview_course.php?catoid=2&coid=1380&display_options[location]=tooltip&show"
id="tt2379" target="_blank">ARTS 003</a>

var myel = document.getElementById('mylink');
alert(myel.textContent);

解决方案:您可以将ID归因于<a>标记,然后获取textContent 就这么简单。

答案 1 :(得分:0)

您可以使用jQuery .txt()函数。像这样:

var txt = $('a').txt();

var txt = $('a[id^="tt"]').txt();