我正在尝试(在R中)从以下地址获取一些数据:
http://www.soccerbase.com/matches/results.sd?date=2012-11-04
即,当我按下 i 按钮时,我想获得页面上显示的匹配详细信息。但是,单击按钮时显示的信息不包含在原始html代码中。我只能看到一条线(我希望数据包含在哪里)......
<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span>
......这几乎让我陷入了死胡同......任何想法?
答案 0 :(得分:4)
require(XML)
require(RCurl)
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04'
sdata<-htmlParse(dataurl)
sid<-xpathSApply(sdata,'//*/tr/@id')
sid<-gsub('^tgc','',sid)
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid)
以上代码将获取其他数据所需的URL。不过,我会向网站查询有关收获数据的信息。