scrapy中的新手:如何回复.css废弃文本部分?

时间:2014-07-22 06:42:36

标签: python css-selectors web-scraping scrapy

当我练习时,我想只捕捉文本部分(1,2,3,4,5 ......),没有部分我怎样才能写出response.css(“td [class ='c1'' ]“)?

scrapy shell "https://tw.movies.yahoo.com/chart.html"
response.css("td[class='c1']")

enter image description here

1 个答案:

答案 0 :(得分:3)

以下是两个选项,一个使用css(),另一个使用xpath()

>>> response.css("td.c1 > span::text").extract()
[u'1', u'2', u'3', u'4', u'5', u'6', u'7', u'8', u'9', u'10', u'11', u'12', u'13', u'14', u'15', u'16', u'17', u'18', u'19', u'20']
>>> response.xpath("//td[@class='c1']/span/text()").extract()
[u'1', u'2', u'3', u'4', u'5', u'6', u'7', u'8', u'9', u'10', u'11', u'12', u'13', u'14', u'15', u'16', u'17', u'18', u'19', u'20']