我需要从某些链接获取链接以执行爬网,但无论多少次重写xpath,我都无法从html中提取链接。因此,我无法找到从中提取链接的方法。请给我一些解决问题的建议。
这是我要从中提取链接的链接的HTML代码:
<div class="" id="subject1" datacallname="主题_同类主题" params="{'catid':'12','sid':'336'}" isload="1" style="">
<ul class="rail-list">
<li>
<cite class="start0" style="height:16px;">
</cite>
<a href="http://www.gorate.com.my/item-386.html">the Library @ Leisure Ma
</a>
</li>
我如何提取链接"//*[@id="subject1"]/ul/li[1]/a/@href"
和网站
我要抓取链接表单:http://www.gorate.com.my/item-336.html#.Vhx55BOqqkr