我正在使用Biopython的globalcc函数将单词的标准版本和方言版本对齐。不幸的是,有时对齐由于没有明显的原因而失败,并返回一个空列表。
align.globalcc(Word,Dialectal,matchfunc,gapfunctionA,gapfunctionB,gap_char=['-'])
使用“lyödään”,“lywwään”作为单词对失败,即使该程序在许多接近的变体中都按预期方式工作(例如,我对“lyödään”,“lywään”进行了测试,并返回了预期的对齐方式)。
编辑:好的,看来问题出在匹配功能上。通过使用不太严重的惩罚来对齐某些字符,globalcc返回至少一个对齐。但是我仍然对这种行为感到困惑,因为我的印象是globalcc正在对可能的对齐方式进行排序,即即使在任何情况下,即使它的得分非常低,也应该返回最佳对齐方式。