我意识到关于Stack Overflow的几个问题已经提出了类似的要求,但是我似乎无法将它们应用于我的特定问题。我正在尝试将以下json格式的数据转换为数据框。此数据来自以下站点的刮除的kickstarter数据:https://webrobots.io/kickstarter-datasets/
"{\"id\":704877813,\"name\":\"Wellmii\",\"is_registered\":null,\"chosen_currency\":null,\"avatar\":{\"thumb\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=40&h=40&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=872ecbdca14ada8169b88c1794d29591\",\"small\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=160&h=160&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=99039218188220e2690206b2b508b19f\",\"medium\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=160&h=160&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=99039218188220e2690206b2b508b19f\"},\"urls\":{\"web\":{\"user\":\"https://www.kickstarter.com/profile/704877813\"},\"api\":{\"user\":\"https://api.kickstarter.com/v1/users/704877813?signature=1544762516.4e88d80e492ef75c79caff24e220b49c87d522c7\"}}}"
如果将以下代码应用于数据,则会得到一个数据框,其中“ web”和“ api”变量是小标题。我只想要常规数据框中的数据。如何使这些变量成为常规数据帧变量?
df <- data %>%
# make json, then make list
fromJSON() %>%
# remove classification level
purrr::flatten() %>%
# turn nested lists into dataframes
map_if(is_list, as_tibble) %>%
# bind_cols needs tibbles to be in lists
map_if(is_tibble, list) %>%
# creates nested dataframe
bind_cols()
数据框应具有以下变量:id,名称,is_registered,selected_currency,thumb,small,medium,web.user,api.user。最后两个变量在末尾并不需要.user。 “ id”的数据应为704877813,名称应具有Wellmii,is_registered应为null或NA,等等。数据中有两个较大的部分,一个称为“头像”,另一个称为“ url”,其中“头像”部分包括thumb,small和medium变量,而urls部分包括web.user和api.user变量。
答案 0 :(得分:1)
不确定是否需要使用map_if
,但是可以使用unnest
将列表列设置为标准向量。如果列表列以不同维度结尾,则此方法将行不通。在这种情况下,您应该直接提取所需的内容。
library(tidyverse)
library(jsonlite)
data <- "{\"id\":704877813,\"name\":\"Wellmii\",\"is_registered\":null,\"chosen_currency\":null,\"avatar\":{\"thumb\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=40&h=40&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=872ecbdca14ada8169b88c1794d29591\",\"small\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=160&h=160&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=99039218188220e2690206b2b508b19f\",\"medium\":\"https://ksr-ugc.imgix.net/assets/022/981/694/75c6b5ca6616e3a3adaa295fcef9d318_original.png?ixlib=rb-1.1.0&w=160&h=160&fit=crop&v=1541445663&auto=format&frame=1&q=92&s=99039218188220e2690206b2b508b19f\"},\"urls\":{\"web\":{\"user\":\"https://www.kickstarter.com/profile/704877813\"},\"api\":{\"user\":\"https://api.kickstarter.com/v1/users/704877813?signature=1544762516.4e88d80e492ef75c79caff24e220b49c87d522c7\"}}}"
data %>%
fromJSON() %>%
purrr::flatten() %>%
bind_rows() %>%
unnest()
#> # A tibble: 1 x 7
#> id name thumb small medium web api
#> <int> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1 7.05e8 Wellm… https://ksr… https://ks… https://ksr… https:/… https://ap…
由reprex package(v0.2.1)于2018-12-27创建