无法再从网站上抓取数据

时间:2019-05-07 14:01:55

标签: r json web-scraping

大约一个月前,我可以使用下面的代码访问此URL指向的JSON文件。现在,我收到以下错误消息:

library(RCurl)

url <- "https://petition.parliament.uk/archived/petitions/169973.json"
web <- getURL(url)

Error in function (type, msg, asError = TRUE)  : 
  error:14077410:SSL routines:SSL23_GET_SERVER_HELLO:sslv3 alert handshake failure

是否有一种方法可以重新启用这种访问?这是相关的sessionInfo()。谢谢。

R version 3.5.1 (2018-07-02)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)

other attached packages:
[1] RCurl_1.95-4.12 bitops_1.0-6   

1 个答案:

答案 0 :(得分:2)

我注意到RCurl软件包对SSL证书似乎有些挑剔。虽然我敢肯定有解决方法,但似乎httr软件包在默认情况下要好一些。这是您使用该程序包获取数据的方式

library(httr)
url <- "https://petition.parliament.uk/archived/petitions/169973.json"
web <- content(GET(url))