我想用html清理器解析这种类型的HTML ..
<div class="result-item yt-uix-tile yt-tile-default *sr">
<div class="thumb-container">
<a href="/watch?v=NZiEqhrIL_k" class="ux-thumb-wrap contains-addto result-item-thumb">
<span class="video-thumb ux-thumb yt-thumb-default-138 ">
<span class="yt-thumb-clip">
<span class="yt-thumb-clip-inner">
<img onload="tn_load(2)" alt="Thumbnail" src="//i3.ytimg.com/vi/NZiEqhrIL_k/default.jpg" width="138" >
<span class="vertical-align"></span>
</span>
</span>
</span>
<span class="video-time">2:40</span>
在其中我只想获得href(href =“/ watch?v = NZiEqhrIL_k”)值。我怎样才能实现它。提前谢谢。
答案 0 :(得分:0)
快速而又脏,用javascript,
因此,对于退货中的每一行,请设置thisLine:
var thisLine = "<a href=\"/watch?v=NZiEqhrIL_k\" class=\"ux-thumb-wrap contains-addto result-item-thumb\">";
然后找到你想要的位的开头和结束:
var startPos = thisLine.indexOf("<a href=\"/watch?");
thisLine = thisLine.substring(startPos+2);
var endPos = thisLine.indexOf("class=");
thisLine = thisLine.substring(0,endPos-1);
可能有1000种方法可以执行此操作...查看右侧的相关问题,或搜索parse html response
。