我目前正在开展一个需要制作自定义图表(here are some examples)的项目。这些图基于DNA或蛋白质比对,其中x轴位于DNA或蛋白质序列中,并且字母的高度是在该位置发生的碱基或氨基酸的频率。我可以做所有的计算,但这是我第一次尝试制作图形,甚至不知道从哪里开始弄清楚如何制作这个。欢迎任何帮助,这个项目需要在python(生物信息学世界的当前炒作)。
答案 0 :(得分:1)
查看matplotlib for python
答案 1 :(得分:1)
您应该检查与(序列)Motifs搜索相关的程序 Biopython有module for this purpose。
此外,您可以检查LaiaMotifs(此处为作者)的来源,该来源针对多肽,但可以很容易地适应DNA。
这是LaiaMotifs可以获得的典型数字:
为了回答关于策略的问题,LaiaMotifs使用每个氨基酸的图像。然后,它计算每个位置的频率,并考虑这些值调整图像大小。每个位置都是一列字母。最后,您将加入图中的所有列。对于所有这些图像处理,您使用PIL库。