R:将带有空元素的嵌套列表转换为data.frame(来自json)

时间:2015-12-16 13:07:25

标签: json r list dataframe

我导入了一个像这样的json文件:

library(rjson)
json_str <- '[{"id": 1, "code": 7909, "text": [{"col1": "a", "col2": "some text"}], "date": "2015-12-01"}, {"id": 2, "code": 7651, "text": [], "date": "2015-12-01"}, {"id": 3, "code": 4768, "text": [{"col1": "aaa", "col2": "Blah, blah"}, {"col1": "bbb", "col2": "Blah, blah, blah"}], "date": "2015-12-01"}]'
my.list <- fromJSON(json_str)
str(my.list)

毋庸置疑,真实档案要长得多。

结果我获得了一个包含3个元素的嵌套列表,其中每个元素都是4的列表,然后,元素$text是一个从无到有任意数量的元素的可变长度列表,在我的例子中,通常不超过3个。

经过一些研究后,我找到了几个关于将list转换为data.frame的答案,例如herehere。但是,当'$ text`中的一个或多个嵌套列表为空时,它们都不起作用。

do.call(rbind, lapply(my.list, data.frame, stringsAsFactors=FALSE))

library(data.table)
rbindlist(my.list, fill=TRUE)

两者都返回错误。

我想将$text中的列表转换为data.frame的多个列,或只转换一个(粘贴内容)。

另一种选择是能够跳过一些元素(比如$text)并转换列表的其余部分,然后在一个单独的行中将这些元素(比如$text)转换为另一个{ {1}}。我想我可以某种方式将data.frame与另一方联系起来。

任何人都可以告诉我如何做到这一点。 感谢

1 个答案:

答案 0 :(得分:1)

听起来,以下内容应该有效:

do.call(rbind.data.frame, lapply(my.list, function(x) {
    x[["text"]] <- toString(unlist(x[["text"]]))
    x
}))
##    id code                                   text       date
## 2   1 7909                           a, some text 2015-12-01
## 21  2 7651                                        2015-12-01
## 3   3 4768 aaa, Blah, blah, bbb, Blah, blah, blah 2015-12-01

这符合您将值粘贴在一起的想法(此处使用toString)在data.frame中形成一个列。