如何使用XPath选择链接的内部文本?

时间:2016-06-01 02:07:05

标签: javascript css xpath scrapy href

我正在使用Scrapy抓取数据。

在浏览器的JS控制台上,我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]')以获得我需要的内容,但我需要过滤数据。

以下图片是$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令结果。

JS console result

如何编写xpath命令以获取绿色框中的数据?我试过了$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]'),但这不是我想要的。

谢谢!

1 个答案:

答案 0 :(得分:5)

要在所选<a>中选择div元素的内部文字,您只需将/a/text()附加到选择div

的XPath中
//div[@class="summary"]//div[contains(@class, "tags")]/a/text()