Question

我有一个带有字符数据的data.frame，我希望最终得到一个具有相同列标题但每个值都有计数的矩阵。到目前为止，我可以得到一个我想要的维度的空矩阵，但是当我尝试用计数填充myMatrix时，它不起作用。

myData <- data.frame(a=LETTERS[5:8], b=LETTERS[6:9], c=rep(LETTERS[5:6],2), d=rep(LETTERS[7],4))
#   a b c d
# 1 E F E G
# 2 F G F G
# 3 G H E G
# 4 H I F G
myValues <- sort(unique(unlist(myData))) # E F G H I
myList <- lapply(myData, table)
myMatrix <- matrix(nrow=length(myValues), ncol=length(myList), dimnames=list(myValues,names(myList)))
#    a  b  c  d
# E NA NA NA NA
# F NA NA NA NA
# G NA NA NA NA
# H NA NA NA NA
# I NA NA NA NA

到目前为止一切顺利。这是不符合我期望的那部分：

lapply(seq_along(myList), function(i) {myMatrix[names(myList[[i]]),names(myList[i])] <- myList[[i]]})

它返回正确的值，但myMatrix仍然充满了NA。奇怪的是，这个有效：

myMatrix[names(myList[[2]]),names(myList[2])] <- myList[[2]]
#    a  b  c  d
# E NA NA NA NA
# F NA  1 NA NA
# G NA  1 NA NA
# H NA  1 NA NA
# I NA  1 NA NA

为什么myMatrix的作业在lapply内失败，如何让它工作（没有for循环）？

Answer 1

这是一种返回data.frame

的方法

# create table, convert to data.frames then give appropriate column names
myList <- Map(setNames, lapply(lapply(myData, table), data.frame),  Map(c, 'Var', names(myList)))
# merge recursively
Reduce(function(...) merge(..., by = 'Var', all = T), myList)
  Var  a  b  c  d
1   E  1 NA  2 NA
2   F  1  1  2 NA
3   G  1  1 NA  4
4   H  1  1 NA NA
5   I NA  1 NA NA

Answer 2

@ horizon对于您使用lapply无法按预期工作的原因是正确的。您必须将<-替换为<<-才能使其正常工作，但*apply函数通常认为这种副作用存在不良行为。

相反，您可以使用

sapply(lapply(myData, factor, unique(unlist(myData))), table)

#   a b c d
# E 1 0 2 0
# F 1 1 2 0
# G 1 1 0 4
# H 1 1 0 0
# I 0 1 0 0

Answer 3

这是一个替代版本，可能不必要地复杂，但会返回每个值在另一个内的计数矩阵。

t(
  sapply(
    as.character(unique(unlist(myData))),
    function(x) 
      lapply(myData,function(y) sum(y==x))
        )
)

结果：

矩阵赋值在lapply中失败

3 个答案: