Question

我正试图从http://www.oddsportal.com/basketball/usa/nba-2014-2015/results/

中的表中搜索数据

我想要的特定表有class =＆＃34; table-main＆＃34;

从scrapy response.xpath（＆＃39; // table＆＃39;）

运行

In [28]:  response.xpath('//table')
Out[28]:
[<Selector xpath='//table' data=u'<table>\n\t\t\t\t\t\t\t\t<tr>\n\t\t\t\t\t<td c
lass="bol'>,
 <Selector xpath='//table' data=u'<table class="table-main top-event">\n\t\t\t'>
,
 <Selector xpath='//table' data=u'<table>\n\t\t\t\t\t<tr>\n\t\t\t\t\t\t<td>\n\t\
t\t\t\t\t\t<tab'>,
 <Selector xpath='//table' data=u'<table class="rm-bonus-offer">\n\t\t\t\t\t\t\t
\t<'>,
 <Selector xpath='//table' data=u'<table>\n\t\t\t\t\t<tr>\n\t\t\t\t\t\t<td>\n\t\
t\t\t\t\t\t<tab'>,
 <Selector xpath='//table' data=u'<table class="rm-bonus-offer">\n\t\t\t\t\t\t\t
\t<'>]

不会返回我想要刮的表。有人可以帮忙吗？

Answer 1

只需使用......

sel.xpath('.//table[starts-with(@class, "table-main")]')

或

sel.xpath('.//div[@id="top-event-box"]/table')

Answer 2

我设法通过response.xpath获取该表（＆＃39; // * [@ id =＆＃34; tournamentTable＆＃34;]＆＃39;）

Answer 3

Selector(response).xpath('//table[contains(@class, "table-main")]').extract_first()

我已经测试过，它有效。

请参阅scrapy doc

中的Selectors

Scrapy没找到桌子

3 个答案: