我有一个病毒基因整合的人类基因,数据框或文本文件格式如下:
['red', 'green']
它是50000个核苷酸长。我还有病毒基因数据框,我之前发现了它的标准偏差和平均频率。我试图通过将人类基因分成1000个核苷酸长的片段来找到这个病毒基因的大致位置,并通过频率和标准偏差值找到该位置。
答案 0 :(得分:1)
你仍然可以在R中应用相同的成对比对方法,并且它比通过频率等自己尝试更容易/更准确。它仍然使用一些相同的原则。 This page将为您提供许多有关如何在R中执行此操作的详细示例。在页面的中间部分是与您的问题直接相关的示例。