所以我对网络抓取有点新意,所以我想我应该在这里问一下,我似乎无法找到答案或在某个地方寻找答案,所以在这里。
response.css("#stream-item-tweet-988415011382091776 > div:nth-child(1) > div:nth-child(2) > div:nth-child(2) >p:nth-child(1)::text").extract()
这是我目前从推文中提取文字的方法。
我需要找到一种对988415011382091776
进行野外梳理的方法,以便从#stream-item-tweet-**
中提取任何内容并继续使用其余部分。
如果我需要学习一些东西,请指出正确的方向。任何输入都会很棒。
答案 0 :(得分:0)
然后代码最终给了我所需的所有信息。
response.xpath('//*[contains(@class, "TweetTextSize TweetTextSize--normal js-tweet-text tweet-")]/text()').extract()
bosnjak对你很有帮助