我实际上是在python3中构建一个脚本来计算几个配对序列之间的差异。因此,我需要在2个蛋白质序列之间进行比对,然后与2个dna序列进行密码子比对。为了进行我的第一次对齐(2个蛋白质序列之间),我实际上正在使用
alns = pairwise2.align.globalds(prot1 ,prot2, matrix, gap_open, gap_extend)
但我需要一些更软化的ClustalW或MUSCLE算法。问题是我的脚本是按照我要求4个序列的方式构建的:2个dna和2个氨基酸。
然后我用字符串转换我的序列。但是ClustalW和MUSCLE要求提供包含这些序列的文件。有没有办法给出这样的序列:
muscle_cline = MuscleCommandline(muscle_exe, prot1 , prot2, out=out_file)
instead of the input file (unaligned sequences file):
muscle_cline = MuscleCommandline(muscle_exe, input=in_file, out=out_file)
或者那样:
clustalw_cline = ClustalwCommandline("clustalw2", prot1, prot2)
instead of that:
clustalw_cline = ClustalwCommandline("clustalw2", infile=in_file)
因为我不想为我的每个序列(大约450)创建一个我的序列未对齐的文件......
非常感谢你。