谷歌趋势阅读线与r

时间:2014-07-21 14:42:07

标签: r curl rcurl google-trends

我有一个简单的网址 http://www.google.com/trends/fetchComponent?q=amazon&date=today%203-m&cid=TIMESERIES_GRAPH_0&export=3

将其放入readLines会给我一个错误

readLines("http://www.google.com/trends/fetchComponent?q=amazon&date=today%203-m&cid=TIMESERIES_GRAPH_0&export=3")

Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") :
  cannot open: HTTP status was '203 Non-Authoritative Information'

我确定我必须使用像RCurl这样的东西并登录谷歌(就像其他帖子中建议的那样)。但我的问题是,为什么我的方法不起作用?我在没有登录的情况下在几个浏览器中尝试了这个URL,但是在R中使用它并不起作用。谁能给我一些指示?

修改

我认为问题是因为我的IP或其他内容被阻止了。我在几台计算机上试过它,结果总是一样的:它在R中工作了3到4次,而且还没有,但仍然没有。不过它可以在浏览器中使用。

1 个答案:

答案 0 :(得分:0)

如果您愿意尝试使用其他方法在网站中阅读,则可以使用XML库。 例如,

library(XML)
url <-"http://www.google.com/trends/fetchComponent?q=amazon&date=today%203 m&cid=TIMESERIES_GRAPH_0&export=3"

htmlParse(url)

给了我想要的输出。