我在互联网上搜索类似的解决方案,但我找不到具体的解决方案。让我们说a有以下数据框:
a = c(1, 1, 1, 2, 2)
b = c(2, 1, 1, 1, 2)
c = c(2, 2, 1, 1, 1)
d = c(1, 2, 2, 1, 1)
df <- data.frame(a = a, b = b, c = c, d = d)
和df
看起来像这样:
a b c d
1 1 2 2 1
2 1 1 2 2
3 1 1 1 2
4 2 1 1 1
5 2 2 1 1
注意:在此示例中,我使用[1,2]
对值,但它可以是一组不同的值:[-1,1]
或甚至超过两个可能的值:{ {1}}。
现在我想要一个矩阵,其中每个[-1,1,2]
元素将代表列[i,j]
和1
的值为i
的行数。对于这种特殊情况,我们有(显示上对角线,因为它是对称的):
j
对角线应计算给定列的 a b c d
a 3 2 1 1
b 3 2 1
c 3 2
d 3
值的行数。在这种情况下,所有列都具有相同的值1
。格式应类似于1
函数(Correlation Matrix)。
我尝试使用cor()
(以及来自table()
包的crosstab
)但它按列对显示信息。
可以通过手动计算每对列的descr
的出现(即:1
)然后放入矩阵来完成,但我想知道是否有内置的简化过程的功能。
答案 0 :(得分:2)
我们可以在crossprod
上使用matrix
来计算问题示例值1
的出现次数:
m1 <- as.matrix(df == 1) # see Note[1]
out <- crossprod(m1)
注意[1] 由@imo指出(请参阅下面的评论)以解决一般情况(值为[x,y]
的矩阵)。对于[0,1]
值df==1
的矩阵,可以用df
替换。要计算问题示例中的2
值,请使用:df == 2
。
如果下对角线应为0
或NA
out[lower.tri(out)] <- NA
out
# a b c d
#a 3 2 1 1
#b NA 3 2 1
#c NA NA 3 2
#d NA NA NA 3