我有一个带有字符数据的data.frame,我希望最终得到一个具有相同列标题但每个值都有计数的矩阵。到目前为止,我可以得到一个我想要的维度的空矩阵,但是当我尝试用计数填充myMatrix
时,它不起作用。
myData <- data.frame(a=LETTERS[5:8], b=LETTERS[6:9], c=rep(LETTERS[5:6],2), d=rep(LETTERS[7],4))
# a b c d
# 1 E F E G
# 2 F G F G
# 3 G H E G
# 4 H I F G
myValues <- sort(unique(unlist(myData))) # E F G H I
myList <- lapply(myData, table)
myMatrix <- matrix(nrow=length(myValues), ncol=length(myList), dimnames=list(myValues,names(myList)))
# a b c d
# E NA NA NA NA
# F NA NA NA NA
# G NA NA NA NA
# H NA NA NA NA
# I NA NA NA NA
到目前为止一切顺利。这是不符合我期望的那部分:
lapply(seq_along(myList), function(i) {myMatrix[names(myList[[i]]),names(myList[i])] <- myList[[i]]})
它返回正确的值,但myMatrix
仍然充满了NA。奇怪的是,这个有效:
myMatrix[names(myList[[2]]),names(myList[2])] <- myList[[2]]
# a b c d
# E NA NA NA NA
# F NA 1 NA NA
# G NA 1 NA NA
# H NA 1 NA NA
# I NA 1 NA NA
为什么myMatrix
的作业在lapply
内失败,如何让它工作(没有for
循环)?
答案 0 :(得分:5)
这是一种返回data.frame
的方法# create table, convert to data.frames then give appropriate column names
myList <- Map(setNames, lapply(lapply(myData, table), data.frame), Map(c, 'Var', names(myList)))
# merge recursively
Reduce(function(...) merge(..., by = 'Var', all = T), myList)
Var a b c d
1 E 1 NA 2 NA
2 F 1 1 2 NA
3 G 1 1 NA 4
4 H 1 1 NA NA
5 I NA 1 NA NA
答案 1 :(得分:2)
@ horizon对于您使用lapply
无法按预期工作的原因是正确的。您必须将<-
替换为<<-
才能使其正常工作,但*apply
函数通常认为这种副作用存在不良行为。
相反,您可以使用
sapply(lapply(myData, factor, unique(unlist(myData))), table)
# a b c d
# E 1 0 2 0
# F 1 1 2 0
# G 1 1 0 4
# H 1 1 0 0
# I 0 1 0 0
答案 2 :(得分:1)
这是一个替代版本,可能不必要地复杂,但会返回每个值在另一个内的计数矩阵。
t(
sapply(
as.character(unique(unlist(myData))),
function(x)
lapply(myData,function(y) sum(y==x))
)
)
结果:
a b c d
E 1 0 2 0
F 1 1 2 0
G 1 1 0 4
H 1 1 0 0
I 0 1 0 0