chi平方和数据框的多列的基本统计

时间:2014-03-26 12:01:38

标签: r statistics plyr

我想计算数据框中每列的卡方检验,并为变量Project分组。

基本上我想为每列计算一个二乘二的表,然后将值存储在一个新表中。

这是我的数据框的一个例子。

structure(list(Project = structure(c(1L, 1L, 1L, 2L, 2L, 2L), .Label = c("discovery", "validation"), class = "factor"), MLL = c(1L, 1L, 1L, 1L, 1L, 1L), CREB = c(0L, 1L, 1L, 1L, 1L, 0L), TNR = c(1L, 1L, 0L, 0L, 1L, 1L)), .Names = c("Project", "MLL", "CREB", "TNR"), row.names = c(1L, 2L, 3L, 300L, 301L, 302L), class = "data.frame")

在Jaap的评论之后我尝试过:

   pvalue <- data.frame(apply(cast_subset[-1] , 2 , function(i)   chisq.test(table(cast_subset$Project , i ))$p.value))
  colnames(pvalue) <- "p.value"

但我无法使用基因名称来匹配其他数据集的列。

0 个答案:

没有答案