建立一个列联表

时间:2015-07-16 10:01:58

标签: r loops contingency

我有这样的数据:

A  B
1 10 
1 20
1 30
2 10
2 30
2 40
3 20
3 10
3 30
4 20
4 10
5 10
5 10

我想构建一个这样的列联表:

   10 20 30 40
10 1   3  2  0
20 3   0  2  0
30 2   2  0  0
40 0   0  0  0

含义:根据A栏,对于特定列联表中B列标记+ 1的每两个值。

你可以帮帮我吗?

1 个答案:

答案 0 :(得分:0)

这是一个非常难看的答案,使用图像中的数据,因为我已经花了太多时间处理你的问题。一般来说,让结果取决于变量的顺序是不切实际的。

A <- rep(c(1:4),c(3,2,3,3))
B <- c(10,10,30,10,20,30,20,10,10,20,30)
data <- data.frame(cbind(A,B))

#split by A
library(plyr)
data2 <- ddply(data,.(A),function(x){
  combined_pairs <- cbind(x$B[-nrow(x)],
                          x$B[-1])
  #return data where first is always lowest
  smallest <- apply(combined_pairs,MARGIN=1,
                    FUN=min)
  largest <- apply(combined_pairs,MARGIN=1,
                   FUN=max)
  return(data.frame(small=smallest,large=largest))
})


library(reshape2)

result <- dcast(small~large,data=data2, 
                fun.aggregate=length) 
> result
  small 10 20 30
1    10  1  3  1
2    20  0  0  2

我认为如果你仍然需要它们,你可以自己添加空行。