我有一个包含多个重复条目的大型数据集。我想先计算一下,每个条目包含多少行,其次,其他每个条目也包含多少行。
作为示例,我使用以下数据:
> A<-c("a","d","d")
>B<-c("b","e","e")`
> C<-c("d","f","r")
> D<-c("f","a","q")
> dat<-data.frame(A,B,C,D)
> dat
A B C D
1 a b d f
2 d e f a
3 d e r q
我会寻找一个结果,该结果计算出现多少“ a”,出现多少“ b”等...我想我可以使用
`>letters=c("a","b","d","e","f","r","q")
>n= length(letters)
>for (i in 1:n){
sum(dat==letters[i])}`
然后我需要知道在包含“ a”的行中出现了多少“ b”,在包含“ a”的行中出现了多少“ d”,在包含“ d”的行中出现了多少“ f”等等...这样我最好以下面的对称矩阵结尾,其中行和列按字母顺序表示每个字母:
>matrix(c(2,1,2,1,2,0,0,1,1,1,0,0,0,0,2,1,3,2,2,1,1,1,0,2,2,1,1,1,2,0,2,1,2,0,0,0,0,1,1,0,1,1,0,0,1,1,0,1,1),nrow=7,ncol=7)
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 2 1 2 1 2 0 0
[2,] 1 1 1 0 0 0 0
[3,] 2 1 3 2 2 1 1
[4,] 1 0 2 2 1 1 1
[5,] 2 0 2 1 2 0 0
[6,] 0 0 1 1 0 1 1
[7,] 0 0 1 1 0 1 1
任何帮助将不胜感激。
谢谢