用ddply进行R kruskal测试

时间:2014-11-11 09:45:34

标签: r statistics

我有一个包含3个因子级别和2个响应变量的数据框。 我想看看每个f1'条件' “和”的数量是多少?每个f2'显着不同。

> str(qval_smhub_mltP)
'data.frame':   1401045 obs. of  5 variables:
 $ gene     : Factor w/ 10695 levels "P10-Lib-othLoc-PA0003-recF-NA-7881-b3700-eco.recF",..: 3361     4513 3219 3089 3988 4519 4414 4132 3072 4432 ...
 $ condition: Factor w/ 131 levels "A22.0.5","A22.1",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ qval     : num  0.601 0.731 0.383 0.68 0.143 ...
 $ plate    : Factor w/ 7 levels "P10","P11","P5",..: 3 3 3 3 3 3 3 3 3 3 ...
$ pheno    : num  0 0 0 0 0 0 0 0 0 0 ...

我尝试了以下ddply解决方案。

        CondPlate_PhenoPval<-ddply(qval_smhub_mltP,"condition",
    function(x) {
        k<-kruskal.test(pheno~plate,data=qval_smhub_mltP)
       # if (k$p.value < 0.05){
       #     ggplot(x,aes
       #     ggsave(file = paste(out_dir(paste(set,org,x$condition,"boxplotPhenoPerPlate.pdf",sep="."),sep="")))
       # }
    with(k,data.frame(statistic,p.value))
    }
)

但是,我认为输出是错误的,因为我得到了每个条件的相同答案。 关于我做错的任何想法。 离。

119               STREPTOMYCIN.4  440.3202 5.943961e-92
120        SULFAMONOMETHOXINE.50  440.3202 5.943961e-92
121                     TEMP.30D  440.3202 5.943961e-92
122                     TEMP.42D  440.3202 5.943961e-92
123             TIGECYCLINE.0.25  440.3202 5.943961e-92
124              TIGECYCLINE.1.6  440.3202 5.943961e-92
125              TOBRAMYCIN.0.01  440.3202 5.943961e-92
126             TOBRAMYCIN.0.025  440.3202 5.943961e-92
127              TOBRAMYCIN.0.05  440.3202 5.943961e-92
128               TOBRAMYCIN.0.1  440.3202 5.943961e-92
129                VERAPAMIL.500  440.3202 5.943961e-92
130                YEPD.CANDIDAC  440.3202 5.943961e-92

另外,如果我想为每个条件保存箱图,那么上面的注释部分是否正确?

0 个答案:

没有答案