我想看看受影响的群体中是否有比没有受影响的群体更多的基因
我首先想到Fisher精确测试是正确的但是因为受影响的组和没有受影响的组是相关的(配对)所以在我看来McNemar测试更正确吗?
当我尝试测试时,它返回给我一个显着的p值2.2-e16,即使基因的载体在受影响的组和没有受影响的组中都是相同的,这可能会说这个基因的富集在其中一个两组?
相反,当我尝试进行Fisher测试时,我的p值为1对我有意义,因为基因数量在受影响和受影响时均相等。但由于配对数据我无法使用此测试。
tt = with(data, table(Disease, Gene))
tt
Gene
Disease NoCarrier Carrier
NoAffected 2043 57
Affected 2043 57
mcnemar.test(tt)
McNemar's Chi-squared test with continuity correction
data: tt
McNemar's chi-squared = 1876.3, df = 1, p-value < 2.2e-16
由于
答案 0 :(得分:2)
在McNemar测试中,零假设是t 被分类为单元格[i,j]和[j,i]的概率是相同的。
因此p值应该很小。考虑i = 1且j = 2的情况。
H0:在第1行第2列结束的概率 只有57次观察=在第2行第1列中结束的概率 哪里有2,043
我们绝对可以拒绝零假设!
有关详细信息,请参阅?mcnemar.test
。