Scrapy通配符和多个类

时间:2018-04-23 20:44:13

标签: python web-scraping scrapy

所以我对网络抓取有点新意,所以我想我应该在这里问一下,我似乎无法找到答案或在某个地方寻找答案,所以在这里。

response.css("#stream-item-tweet-988415011382091776 > div:nth-child(1) > div:nth-child(2) > div:nth-child(2) >p:nth-child(1)::text").extract()

这是我目前从推文中提取文字的方法。

我需要找到一种对988415011382091776进行野外梳理的方法,以便从#stream-item-tweet-**中提取任何内容并继续使用其余部分。

如果我需要学习一些东西,请指出正确的方向。任何输入都会很棒。

1 个答案:

答案 0 :(得分:0)

然后代码最终给了我所需的所有信息。

response.xpath('//*[contains(@class, "TweetTextSize TweetTextSize--normal js-tweet-text tweet-")]/text()').extract()

bosnjak对你很有帮助