Question

所以我对网络抓取有点新意，所以我想我应该在这里问一下，我似乎无法找到答案或在某个地方寻找答案，所以在这里。

response.css("#stream-item-tweet-988415011382091776 > div:nth-child(1) > div:nth-child(2) > div:nth-child(2) >p:nth-child(1)::text").extract()

这是我目前从推文中提取文字的方法。

我需要找到一种对988415011382091776进行野外梳理的方法，以便从#stream-item-tweet-**中提取任何内容并继续使用其余部分。

如果我需要学习一些东西，请指出正确的方向。任何输入都会很棒。

Answer 1

然后代码最终给了我所需的所有信息。

response.xpath('//*[contains(@class, "TweetTextSize TweetTextSize--normal js-tweet-text tweet-")]/text()').extract()

bosnjak对你很有帮助