根据定义了binsize的bin对列表进行分区

时间:2019-04-11 20:46:25

标签: python bioinformatics

我有一个字典,每个键都有一个值列表,其中键是像chr1,chr2这样的染色体编号,而值是突变的位置。这些值是整数,我必须将这些值归为325的bin大小。基本上,我已经找到了每个染色体在325个碱基的区域中有多少个突变。

我想出的代码可以做到这一点: 对于每个键 创建大小为325(从值列表中的最小值到最大值)的bin。 遍历循环,查看哪个位置适合哪个垃圾箱并打印出来。

所以我得到的结果是

chr8     (55655029, 55655353)    [55655353]
chr8     (55655354, 55655678)    [55655365]
chr8     (5113304, 5113628)      [5113558]
chr8     (5115579, 5115903)      [5115598]

这使得前两个值位于不同的bin中,而前两个值非常接近,应该分组在一起?

我是否一直在滑动垃圾箱,或者是否可以通过将每个染色体划分为列表来对位置进行分区?

1 个答案:

答案 0 :(得分:0)

您不需要“滑动垃圾箱,直到它们适合为止”。

鉴于您提到的信息,您应该可以直接联系!使用标准的模数学功能将垃圾箱出库吗?