为DNA比对序列创建序列标识

时间:2018-01-29 15:42:54

标签: bayesian dna-sequence information-theory probability-distribution

如何为对齐的DNA序列创建序列标识?对于Kevin Murphy书中的给定序列(第2章,figure 2.5),我使用此wiki_link得出徽标我没有得到预期的结果。

DNA序列:

  1. a t a g c c g g t a c g g c a
  2. t t g g c c a a c c g c a
  3. t c a c c a c a g a g c a
  4. a t a a c c g c c a c c g c a
  5. t t g g c t a a g g t a
  6. t a c c c c t a c g a a
  7. t t c g t t c c g c c
  8. a t a t c g g t a c a g t a
  9. a t a g c a g g a a c c a a
  10. a c a t c c g a g g g a a

2 个答案:

答案 0 :(得分:0)

如果您不需要开发自己的版本:

有一个python库可以解决这个问题。

https://pypi.python.org/pypi/weblogo

或网络版

http://weblogo.berkeley.edu/logo.cgi

答案 1 :(得分:0)

您可以使用上面添加的weblogo来做到这一点,这里有一些代码可以在python中实现

from Bio.Seq import Seq
from Bio import motifs
instances = df['binding'] #just input the list of DNA sequences 
m = motifs.create(instances)
m.weblogo('logo.png')

在这里,您必须提供实例作为DNA序列列表,结果将另存为logo.png,或者您可以根据需要将png更改为jpeg或tiff。