我想访问带有R和rcurl包的网页。 这是我的代码:
library(RCurl)
library(XML)
URL <- "http://www.lfp.fr/ligue1/calendrier_resultat#sai=82&jour=1"
siteHTML <- getURL(url=URL)
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue)
Date_Match
结果不好......就好像jour = 1参数不存在一样。 如果我尝试使用Firefox访问此页面,那就没关系。
我也试过这段代码但没有成功:
x <- getForm("http://www.lfp.fr/ligue1/calendrier_resultat",
jour="2",
sai="82")
xmltext <- htmlParse(x, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue)
Date_Match
你知道为什么吗?解决办法是什么 ?你能帮助我吗 ?
我是R编程的初学者,所以不要犹豫,给出大的解释。
答案 0 :(得分:1)
在网址中使用?
代替#
:
library(RCurl)
library(XML)
URL <- "http://www.lfp.fr/ligue1/calendrier_resultat?sai=82&jour=1"
siteHTML <- getURL(url=URL)
xmltext <- htmlParse(siteHTML, asText=TRUE, encoding = 'UTF-8')
Date_Match <- sapply(xpathSApply(xmltext, '//*[@id="tableaux_rencontres"]//h4'), xmlValue)
Date_Match
# [1] "Vendredi 14 février 2014" "Samedi 15 février 2014" "Dimanche 16 février 2014"