使用R&R的XML包刮取限制访问的网站

时间:2012-05-11 17:33:20

标签: xml r proxy web-scraping

我正在尝试使用R中的XML包从限制访问网站(我所在机构的图书馆允许我访问)中获取数据。该库使我可以使用EZproxy进行访问。

base <- "the URL"
tabs <- readHTMLTable(base)

这些行给出了下面的输出。饼干似乎正在发生一些事情。我的计算机上的两个浏览器都启用了cookie。我如何成功从网站上抓取数据?提前谢谢!

$`NULL`
                                                                                                                                                                          V1
1                                                                                                                                                                           
2                                                                                                                                                           Cookies disabled
3                                                                                                                                                                           
4 Your browser currently does not accept cookies.\rCookies need to be enabled for Scopus to function properly.\rPlease enable session cookies in your browser and try again.

$`NULL`
  V1 V2 V3
1         

$`NULL`
                V1
1 Cookies disabled

$`NULL`
  V1
1   
2   
3

0 个答案:

没有答案