如何根据Fst值计算p值?

时间:2019-05-06 13:56:43

标签: r unix

我有一个ped文件,其中包含每个indiv的40k SNP数据。然后,我使用了来自gwscaR函数的plink --fst和fst.one.plink来计算成对的Fst值。 现在,我正在尝试估算每个Fst值的p值。

我一直在网上搜索该怎么做,但是我没有运气。主要的问题是人们用几种不同的方式来计算。 我已经阅读了adegenet论坛(https://lists.r-forge.r-project.org/pipermail/adegenet-forum/2011-February/000214.html),并尝试复制该问题,但我做不到。

在这里,我展示了一些与第一个基因座对应的结果。

Locus Hs1 Hs2 Hs Ht Fst NumAlleles Num1 Num2 1 0.398022893 0.488861662 0.443442277 0.877651614 0.494739974 2 93 335 1 0.375 0.384513255 0.379756627 0.44475259 0.146139593 2 94 335 1 0.364135355 0.408892849 0.386514102 0.456778573 0.15382611 2 94 335 1 0.198449525 0.294052127 0.246250826 0.97885788 0.74843046 2 94 335 1 0.346989588 0.25395411 0.300471849 0.965281506 0.688721013 2 94 335 1 0.222725215 0.321786589 0.272255902 0.972914722 0.72016468 2 94 335 1 0.499094613 0.496507017 0.497800815 0.780539438 0.362234897 2 94 335 1 0.010581711 0.026504789 0.01854325 0.018664076 0.006473677 2 94 335 1 0.206654595 0.284361773 0.245508184 0.267831476 0.083348277 2 94 335 1 0 0 0 1 NA 1 94 328 1 0.33499321 0.43108394 0.383038575 0.930531589 0.588365855 2 94 334 1 0 0 0 1 NA 1 94 334

如何计算每个Fst的p值?

到目前为止,我一直在尝试使用R中的chisq.test()来计算它,如所示的herechisq.test(x, simulate.p.value=TRUE)

结果是data.frame,其中包含观测值,期望值,残差,平方残差数据和仅一个-全局 p 值。我对此不满意,因为我想要的是单个p值,而不是全局值。

现在,我正在尝试进行ANOVA测试。

1 个答案:

答案 0 :(得分:0)

here中描述的方法应达到预期的结果:根据协议说明,结果对象将包含测试列表,每对人群均应进行一次测试,并应给出相应的 p -value打印时。例如。您将为每个测试/总体对获得一个 p 值。