我有一个FASTA文件,其中包含我已解析并存储到字典中的ID和相应的DNA序列。 现在,我需要编写一个Python程序,计算所有序列的成对汉明距离矩阵。
到目前为止,我已经尝试在字典的所有值上运行一个for循环并检查每个字符,但这不能正确实现汉明距离或返回矩阵。
答案 0 :(得分:0)
尝试使用sklearn软件包,它具有一项功能,可以使用指定的距离度量来计算两两之间的距离。您可以在这里找到函数:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise_distances.html。