R - 从列表列表构造稀疏矩阵

时间:2017-05-04 04:18:11

标签: python r pandas

使用python和pandas我可以从字典对象列表中轻松构造一个稀疏的DataFrame。以下代码段显示了如何在pandas中完成此操作:

In [1]: import pandas as pd; (pd.DataFrame([{'a':1, 'b':10}, 
                                            {'d':99, 'c':1},
                                            {'b':1, 'd': 4}])
                                .fillna(0))
Out[1]: 
     a     b    c     d
0  1.0  10.0  0.0   0.0
1  0.0   0.0  1.0  99.0
2  0.0   1.0  0.0   4.0

如果我想在R中轻松重现此行为怎么办?让我们假设我有以下变量:

values <- list(list(a = 1, b = 10),
               list(d = 99, c = 1),
               list(b = 1, d = 4))

然后,如何使用R?

获得在python中获得的相同结果

4 个答案:

答案 0 :(得分:5)

我们可以在melt

中将xtabsR一起使用
library(reshape2)
xtabs(value~L1 + L2, melt(values))
#     L2
#L1   a  b  c  d
#  1  1 10  0  0
#  2  0  0  1 99
#  3  0  1  0  4

答案 1 :(得分:3)

使用dplyr你可以这样做:

library(dplyr)
values %>% bind_rows() %>% mutate_all(function(x) coalesce(x, 0))

# A tibble: 3 × 4
      a     b     d     c
  <dbl> <dbl> <dbl> <dbl>
1     1    10     0     0
2     0     0    99     1
3     0     1     4     0

答案 2 :(得分:2)

以下是plyr包的解决方案:

ldply(values, data.frame)

   a  b  d  c
1  1 10 NA NA
2 NA NA 99  1
3 NA  1  4 NA


# mutate each to replace NA with 0
ldply(values, data.frame) %>% 
     mutate_each(funs(replace(., is.na(.), 0)))

  a  b  d c
1 1 10  0 0
2 0  0 99 1
3 0  1  4 0

答案 3 :(得分:1)

使用基数R构建矩阵,您可以执行以下操作。

首先,设置

# flatten list to pull out info for matrix construction
flat <- unlist(values)
# build a 0 matrix with correct dimensions and column names
myMat <- matrix(0, nrow=length(values), ncol=length(unique(names(flat))),
                dimnames=list(NULL, sort(unique(names(flat)))))

现在,填写矩阵

for(i in seq_along(values)) myMat[i, names(values[[i]])] <- unlist(values[[i]])

这导致

myMat
     a  b c  d
[1,] 1 10 0  0
[2,] 0  0 1 99
[3,] 0  1 0  4

如果您确实需要data.frame,则可以使用as.data.framedata.frame函数转换矩阵。