根据它们在初始蛋白质中的位置,你会做什么来表示小序列(<= 40个残基)的分布?
我有几个序列如下。第一列是当前序列的编号。第二列是起始位置,第三列是当前序列在其初始蛋白质中的停止位置。
1 18 34
2 39 55
3 30 46
4 20 36
5 22 46
6 22 46
7 25 50
8 33 50
9 46 63
这些序列并非全部来自同一种蛋白质,它们来自不同长度的蛋白质。
最好的想法是在横坐标上绘制这些序列以确定它们是否更多地位于蛋白质的开头或更多位于末端或更多位于中间,考虑到蛋白质不是全部都有相同的长度?
我写了一个算法,根据它们的开始和停止位置在横坐标上映射这些序列,但问题是由于蛋白质的长度不同,因此不能解释图形。我的图表显示序列更多是蛋白质的开始,但这只是因为某些蛋白质比其他蛋白质短,所以这是一个问题。
任何人都有更好的想法吗?
提前致谢。
答案 0 :(得分:0)
蛋白质是否足够相似以进行多序列比对?如果是这样,那么您可以将读数与多序列比对对齐,以便它们都在相同的坐标空间中。