Question

我正在使用Scrapy抓取数据。

在浏览器的JS控制台上，我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]')以获得我需要的内容，但我需要过滤数据。

以下图片是$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令结果。

如何编写xpath命令以获取绿色框中的数据？我试过了$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]')，但这不是我想要的。

谢谢！

Answer 1

要在所选<a>中选择div元素的内部文字，您只需将/a/text()附加到选择div

的XPath中

//div[@class="summary"]//div[contains(@class, "tags")]/a/text()