Question

我一直试图找出如何获得确切的xpath，例如段落中的第三个词：

e.g：

<p>Here is some text</p>

然后，如果我想要第三个单词（＆＃34;一些＆＃34;），我无法弄清楚如何使用xpath单独输出。然而，这里的焦点不是得到单词＆＃34;的一些＆＃34;的完全匹配，而是获得第三个单词（无论它是什么）。

我一直在尝试这个：../ p [3]，但没有帮助。我使用python和scrapy框架。

我希望有人能指出我正确的方向。

谢谢。

Answer 1

如果您正在使用scrapy，因为此问题已被标记，请考虑使用scrapy的.re()支持，即：

>>> response.xpath('//p/text()').re('\w+')[2]
u'some'