有没有办法将数据从JSON文件导入R?更具体地说,该文件是具有字符串字段,对象和数组的JSON对象数组。 RJSON包关于如何处理这个http://cran.r-project.org/web/packages/rjson/rjson.pdf不是很清楚。
答案 0 :(得分:167)
首先安装rjson
包:
install.packages("rjson")
然后:
library("rjson")
json_file <- "http://api.worldbank.org/country?per_page=10®ion=OED&lendingtype=LNX&format=json"
json_data <- fromJSON(paste(readLines(json_file), collapse=""))
自版本0.2.1以来更新
json_data <- fromJSON(file=json_file)
答案 1 :(得分:76)
jsonlite
会将JSON导入数据框。它可以选择展平嵌套对象。嵌套数组将是数据框。
> library(jsonlite)
> winners <- fromJSON("winners.json", flatten=TRUE)
> colnames(winners)
[1] "winner" "votes" "startPrice" "lastVote.timestamp" "lastVote.user.name" "lastVote.user.user_id"
> winners[,c("winner","startPrice","lastVote.user.name")]
winner startPrice lastVote.user.name
1 68694999 0 Lamur
> winners[,c("votes")]
[[1]]
ts user.name user.user_id
1 Thu Mar 25 03:13:01 UTC 2010 Lamur 68694999
2 Thu Mar 25 03:13:08 UTC 2010 Lamur 68694999
答案 2 :(得分:29)
另一个包是RJSONIO。要转换嵌套列表,lapply可以提供帮助:
l <- fromJSON('[{"winner":"68694999", "votes":[
{"ts":"Thu Mar 25 03:13:01 UTC 2010", "user":{"name":"Lamur","user_id":"68694999"}},
{"ts":"Thu Mar 25 03:13:08 UTC 2010", "user":{"name":"Lamur","user_id":"68694999"}}],
"lastVote":{"timestamp":1269486788526,"user":
{"name":"Lamur","user_id":"68694999"}},"startPrice":0}]'
)
m <- lapply(
l[[1]]$votes,
function(x) c(x$user['name'], x$user['user_id'], x['ts'])
)
m <- do.call(rbind, m)
提供有关您的示例中的投票的信息。
答案 3 :(得分:15)
如果URL是https,就像用于Amazon S3一样,那么请使用getURL
json <- fromJSON(getURL('https://s3.amazonaws.com/bucket/my.json'))
答案 4 :(得分:1)
首先安装RJSONIO和RCurl软件包:
install.packages("RJSONIO")
install.packages("(RCurl")
&#13;
在控制台
中使用RJSONIO尝试以下代码
library(RJSONIO)
library(RCurl)
json_file = getURL("https://raw.githubusercontent.com/isrini/SI_IS607/master/books.json")
json_file2 = RJSONIO::fromJSON(json_file)
head(json_file2)
&#13;
答案 5 :(得分:1)
软件包:
我在将json转换为dataframe / csv时遇到了问题。对于我的情况,我做了:
Token <- "245432532532"
source <- "http://......."
header_type <- "applcation/json"
full_token <- paste0("Bearer ", Token)
response <- GET(n_source, add_headers(Authorization = full_token, Accept = h_type), timeout(120), verbose())
text_json <- content(response, type = 'text', encoding = "UTF-8")
jfile <- fromJSON(text_json)
df <- as.data.frame(jfile)
然后从df到csv。
在这种格式中,如果需要,应该很容易将其转换为多个.csv。
重要的部分是内容功能应该type = 'text'
。
答案 6 :(得分:0)
library(httr)
url <- "http://www.omdbapi.com/?apikey=72bc447a&t=Annie+Hall&y=&plot=short&r=json"
resp <- GET(url)
content(resp, as = "text")
content(resp)
使用content()获取resp的内容,但这一次不指定 第二个论点。 R自动找出您要交易的 使用JSON,并将JSON转换为命名的R列表。