我的问题如下:
我在R中得到一个data.frame
,它包含坐标,例如
SNP1 chr1 123456
SNP2 chr1 156895
SNP3 chr1 550000
...
现在我想指定一个区域(例如chr1:100000-500000)和一些SNP
s(n
)并找到n
SNP
个该区域内分布最均匀的区域。
我有一个脚本可以将区域划分为n-1
个片段,并选择最接近片段边界的SNP。它还可以排除两次命名的SNP
并获得下一个最接近的SNP
但仍然可能有一个更好的解决方案来选择它们均匀分布(可能通过某种方式最大化它们之间的总距离但总数SNP
的数量是多少?)。