我有这个HTML
<div class="pagination">
<ul> <li class=""><a href="/cars/?sort=newest"><</a></li>
<li class=""><a href="/cars/?sort=newest">1</a></li>
<li class="active"><a href="/cars/?sort=newest&page=2">2</a></li>
<li class=""><a href="/cars/?sort=newest&page=3">3</a></li>
<li class=""><a href="/cars/?sort=newest&page=4">4</a></li>
<li class=""><a href="/cars/?sort=newest&page=5">5</a></li>
<li class=""><a href="/cars/?sort=newest&page=3">></a></li>
</ul>
</div>
我想在最后href
a
标记的li
我试过了:
.//div[@class='pagination']/ul/li[last()]/a[normalize-space(.)='>']/@href
我正在从xml文件中读取xpath,因此我无法在xml中使用'>'
,因为>
是一个特殊的字符。所以,我用>
替换>
,
但是当我在scrapy shell上测试结果时,我得到了空的结果。
我也试过>
但仍然获得空结果
请帮助