R Rcurl的结果与firefox不同

时间:2014-02-15 13:12:51

标签: ajax r firefox rcurl

我想访问带有R和rcurl包的网页。 这是我的代码:

library(RCurl) library(XML)

URL <- "http://www.lfp.fr/ligue1/calendrier_resultat#sai=82&jour=1"
siteHTML <- getURL(url=URL)
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue) 
Date_Match

结果不好......就好像jour = 1参数不存在一样。 如果我尝试使用Firefox访问此页面,那就没关系。

我也试过这段代码但没有成功:

x <- getForm("http://www.lfp.fr/ligue1/calendrier_resultat",
       jour="2",
       sai="82")
xmltext <- htmlParse(x, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue) 
Date_Match
你知道为什么吗?解决办法是什么 ?你能帮助我吗 ? 我是R编程的初学者,所以不要犹豫,给出大的解释。

1 个答案:

答案 0 :(得分:1)

在网址中使用?代替#

library(RCurl)
library(XML)
URL <- "http://www.lfp.fr/ligue1/calendrier_resultat?sai=82&jour=1"
siteHTML <- getURL(url=URL)
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue)
Date_Match
# [1] "Vendredi 14 février 2014" "Samedi 15 février 2014"   "Dimanche 16 février 2014"