我一直试图找出如何获得确切的xpath,例如段落中的第三个词:
e.g:
<p>Here is some text</p>
然后,如果我想要第三个单词(&#34;一些&#34;),我无法弄清楚如何使用xpath单独输出。然而,这里的焦点不是得到单词&#34;的一些&#34;的完全匹配,而是获得第三个单词(无论它是什么)。
我一直在尝试这个:../ p [3],但没有帮助。我使用python和scrapy框架。
我希望有人能指出我正确的方向。
谢谢。
答案 0 :(得分:2)
如果您正在使用scrapy,因为此问题已被标记,请考虑使用scrapy的.re()
支持,即:
>>> response.xpath('//p/text()').re('\w+')[2]
u'some'