网页抓取需要鼠标点击?

时间:2012-11-06 13:38:14

标签: r web-scraping

我正在尝试(在R中)从以下地址获取一些数据:

http://www.soccerbase.com/matches/results.sd?date=2012-11-04

即,当我按下 i 按钮时,我想获得页面上显示的匹配详细信息。但是,单击按钮时显示的信息不包含在原始html代码中。我只能看到一条线(我希望数据包含在哪里)......

<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span>

......这几乎让我陷入了死胡同......任何想法?

1 个答案:

答案 0 :(得分:4)

require(XML)
require(RCurl)
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04'
sdata<-htmlParse(dataurl)
sid<-xpathSApply(sdata,'//*/tr/@id')
sid<-gsub('^tgc','',sid)
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid)

以上代码将获取其他数据所需的URL。不过,我会向网站查询有关收获数据的信息。