scrapy上的xml特殊字符

时间:2014-09-03 11:05:10

标签: xml xpath scrapy

我有这个HTML

<div class="pagination">
    <ul>    <li class=""><a href="/cars/?sort=newest">&lt;</a></li>
    <li class=""><a href="/cars/?sort=newest">1</a></li>
    <li class="active"><a href="/cars/?sort=newest&amp;page=2">2</a></li>
    <li class=""><a href="/cars/?sort=newest&amp;page=3">3</a></li>
    <li class=""><a href="/cars/?sort=newest&amp;page=4">4</a></li>
    <li class=""><a href="/cars/?sort=newest&amp;page=5">5</a></li>
    <li class=""><a href="/cars/?sort=newest&amp;page=3">></a></li>
</ul>
</div>

我想在最后href

中使用a标记的li

我试过了:

.//div[@class='pagination']/ul/li[last()]/a[normalize-space(.)='>']/@href
在scrapy shell上,它完美无缺。

我的问题

我正在从xml文件中读取xpath,因此我无法在xml中使用'>',因为>是一个特殊的字符。所以,我用>替换&gt;, 但是当我在scrapy shell上测试结果时,我得到了空的结果。

我也试过&gt;但仍然获得空结果

请帮助

0 个答案:

没有答案