R:在数据帧的一列上运行t-测试而不是所有其他列

时间:2013-05-01 12:49:47

标签: r statistics dataframe

我有一个基本形式的数据框:

> head(raw.data)

       NAC     cOF3     APir       Pu       Tu     V2.3     mOF3     DGpf
1 6.314770 6.181188 6.708971 6.052134 6.546938 6.079848 6.640716 6.263770
2 8.825595 8.740217 9.532026 8.919598 8.776969 8.843287 8.631505 9.053732
3 5.518933 5.982044 5.632379 5.712680 5.655525 5.580141 5.750969 6.119935
4 6.063098 6.700194 6.255736 5.124315 6.133631 5.891009 6.070467 6.062815
5 8.931570 9.048621 9.258875 8.681762 8.680993 9.040971 8.785271 9.122226
6 5.694149 5.356218 5.608698 5.894171 5.629965 5.759247 5.929289 6.092337

我想对所有其他列执行每个列的t检验,并将后续p值保存到以下某些变体中的变量:

#run tests
test.result = mapply(t.test, one.column, other.columns)
#store p-values
p.values = stack(mapply(function(x, y) 
     +     t.test(x,y)$p.value, one.column, other.columns))

或者aov()会成为这种分析的更好选择吗?在任何情况下,我想知道如何使用t测试简化它。

1 个答案:

答案 0 :(得分:1)

这是一个解决方案:

读入数据:

dat <- read.table(text='NAC     cOF3     APir       Pu       Tu     V2.3     mOF3     DGpf
1 6.314770 6.181188 6.708971 6.052134 6.546938 6.079848 6.640716 6.263770
2 8.825595 8.740217 9.532026 8.919598 8.776969 8.843287 8.631505 9.053732
3 5.518933 5.982044 5.632379 5.712680 5.655525 5.580141 5.750969 6.119935
4 6.063098 6.700194 6.255736 5.124315 6.133631 5.891009 6.070467 6.062815
5 8.931570 9.048621 9.258875 8.681762 8.680993 9.040971 8.785271 9.122226
6 5.694149 5.356218 5.608698 5.894171 5.629965 5.759247 5.929289 6.092337')

获得所有可能的成对组合:

com <- combn(colnames(dat), 2)

获取p值

p <- apply(com, 2, function(x) t.test(dat[,x[1]], dat[,x[2]])$p.val)

加入数据框:

data.frame(comparison = paste(com[1,], com[2,], sep = ' vs. '), p.value = p)

更好的解决方案是使用rehape包装中的熔体和pairwise.t.test:

library(reshape)
with(melt(dat), pairwise.t.test(value, variable, p.adjust.method = 'none'))

如果您只想将第一列与所有其他列配对,您也可以使用:

x <- sapply(dat[,-1], function(x) t.test(x, dat[,1])$p.value)
data.frame(variable = names(x), p.value = as.numeric(x))