这是我最近第二次遇到这种情况,所以我想要了解是否有更好的方法来解析从jsonlite
返回的数据帧,其中一个元素是存储为列的数组在数据框中作为列表。
我知道这部分功能有jsonlite
,但我不知道如何使用这个嵌套结构。最后,我想我可以编写自己的自定义解析,但鉴于我几乎就在那里,我想看看如何处理这些数据。
例如:
## options
options(stringsAsFactors=F)
## packages
library(httr)
library(jsonlite)
## setup
gameid="2015020759"
SEASON = '20152016'
BASE = "http://live.nhl.com/GameData/"
URL = paste0(BASE, SEASON, "/", gameid, "/PlayByPlay.json")
## get the data
x <- GET(URL)
## parse
api_response <- content(x, as="text")
api_response <- jsonlite::fromJSON(api_response, flatten=TRUE)
## get the data of interest
pbp <- api_response$data$game$plays$play
colnames(pbp)
探索回来的内容:
> class(pbp$aoi)
[1] "list"
> class(pbp$desc)
[1] "character"
> class(pbp$xcoord)
[1] "integer"
从上面,列pbp$aoi
是一个列表。以下是一些条目:
> head(pbp$aoi)
[[1]]
[1] 8465009 8470638 8471695 8473419 8475792 8475902
[[2]]
[1] 8470626 8471276 8471695 8476525 8476792 8477956
[[3]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525
[[4]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525
[[5]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525
[[6]]
[1] 8469619 8471695 8473492 8474625 8475727 8475902
如果我在同一个数据框中解析这些列表,我真的不在乎,但是我有什么选择来解析数据呢?
我更愿意将数据从out列表中取出并将它们解析为一个数据框,该数据框可以与它来自的原始记录“相关”。
提前感谢您的帮助。
答案 0 :(得分:2)
从上面的@hrbmstr,我能够使用unnest
得到我想要的东西。
select(pbp, eventid, aoi) %>% unnest() %>% head