Xpath如果值是扩展字符,如何检查标题值

时间:2017-12-28 20:55:00

标签: python xpath scrapy

这是我想找的HTML

 $credits2 = $this->content::with('credits:credits.id,department,job')
                  ->find($id_content->id);

问题是»什么是

<a href="/audio-books/type/computer/page/2/">»</a>

我试过了:

&raquo;

response.xpath('//div[@class="wp-pagenavi"]/a[@title="»"]' )

但它不起作用。

如果值来自字符实体或扩展字符,是否有某种方法可以检查XPath中的值?

我正试图找到lin到下一页,所以我可以使用

response.xpath('//div[@class="wp-pagenavi"]/a[@title="&raquo;"]' )

这很好。

2 个答案:

答案 0 :(得分:2)

首先,您的路径不正确,因为您使用title属性进行匹配,这是不正确的,该字符位于text()而非title内。这个xpath应该可以工作:

response.xpath(u'//a[./text()="\xbb"]')

答案 1 :(得分:0)

我没有尝试过运行它,但您应该使用小数实体通过XPath查找扩展字符。

对于&raquo;,您应该使用&#187;XPath应该是

div[@class="wp-pagenavi"]/a[@title="&#187;"]'

查看完整图表here以获取参考。

如果它不起作用,您可以使用Unicode character for &raquo;,另外您可以看到post,希望这可以帮助您。