如何使用Biopython中的distancematrix函数?

时间:2016-10-07 21:11:15

标签: python biopython

我想使用http://biopython.org/DIST/docs/api/Bio.Cluster.Record-class.html#distancematrix计算数据集上的距离矩阵(使用遗传距离函数),但我似乎不断收到错误,通常告诉我排名不是2.我'我实际上并不确定它想要什么作为输入,因为文档从未说过,并且没有在线的例子。

说我读了一些对齐的基因序列:

SingleLetterAlphabet() alignment with 7 rows and 52 columns
AEPNAATNYATEAMDSLKTQAIDLISQTWPVVTTVVVAGLVIRL...SKA COATB_BPIKE/30-81
AEPNAATNYATEAMDSLKTQAIDLISQTWPVVTTVVVAGLVIKL...SRA Q9T0Q8_BPIKE/1-52
DGTSTATSYATEAMNSLKTQATDLIDQTWPVVTSVAVAGLAIRL...SKA COATB_BPI22/32-83
AEGDDP---AKAAFNSLQASATEYIGYAWAMVVVIVGATIGIKL...SKA COATB_BPM13/24-72
AEGDDP---AKAAFDSLQASATEYIGYAWAMVVVIVGATIGIKL...SKA COATB_BPZJ2/1-49
AEGDDP---AKAAFDSLQASATEYIGYAWAMVVVIVGATIGIKL...SKA Q9T0Q9_BPFD/1-49
FAADDATSQAKAAFDSLTAQATEMSGYAWALVVLVVGATVGIKL...SRA COATB_BPIF1/22-73

将由

完成
data = Align.read("dataset.fasta","fasta")

但是Cluster.Record类中的距离矩阵不接受这个。我怎样才能让它发挥作用!即

dist_mtx = distancematrix(data)

1 个答案:

答案 0 :(得分:0)

简短的回答:你没有。

来自documentation

  

记录存储基因表达数据和相关信息

Cluster对象用于基因表达数据,而不用于MSA。 我建议使用像MSARC这样的外部工具,它也可以在Python中运行。