我有两个文件(健康与癌症),包含转座元素类和子类(两列),但一个有71602行,另一个72500,我试图把它们作为数据框放在一个文件中进行费希尔测试,看看一个classe在癌症中比在健康组织中更重要但是没有设法得到它。 有谁知道如何获得一个档案并进行费希尔测试?
答案 0 :(得分:0)
Fisher测试的输入是2x2列联表。您想要的是分别在两个文件中读取,然后从中生成一个列联表。您不需要将两个文件合并为一个数据框。例如,你可以做
df1<-data.frame(health=rep("healthy", 5), TE=sample(c("A", "B"), 5, replace=T))
df2<-data.frame(health=rep("cancer", 7), TE=sample(c("A", "B"), 7, replace=T))
ctable<-matrix(c(sum(df1$TE=='A'), sum(df1$TE=='B'), sum(df2$TE=='A'), sum(df2$TE=='B')), nrow=2, ncol=2, dimnames=list(c("A", "B"), c("Healthy", "Cancer")))
ctable
fisher.test(ctable)