我希望通过R。
访问我的Google网站管理员工具的API我从这里看到:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
它需要在https后面提取并解析它。
有关如何操作的任何建议吗?
答案 0 :(得分:2)
根据一些谷歌搜索,我会说RCurl库是你最好的选择。他们有一个很好的例子,说明如何进行一些基本操作并使用XML有效负载:http://www.omegahat.org/RCurl/xmlParse.html
与其他GData服务一样,网站管理员工具api是基于AtomPub的XML。使用XML库进行解析应该相当容易,但是您需要自己编写代码。
布兰登提到的Googleanalytics4r采用了同样的方法。请参阅:https://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R答案 1 :(得分:0)
我猜您可以将Java client与rJava一起使用。
答案 2 :(得分:0)
它有点hacky,但我通过python工具(http://code.google.com/p/webmaster-tools-downloads/source/browse/downloader.py)从R访问GWT数据,通过发出system()命令,例如。
feedback <- system("python ./gwt-tool/googlewebmastertool_download_gmt.py")
“反馈”将是从脚本生成的消息,并且文件出现在系统调用的工作目录中。
更好的解决方案是使用httr包来发出请求(这是上面提到的RCurl的包装器) - 我发现httr可以解决RCurl可能出现的一些配置问题。