我需要计算DNA序列之间的编辑距离,以便将相似的序列组合在一起。如果序列的距离大于某个阈值,则它们被认为是不同的,我不关心实际值是什么,所以我自然希望设置Levenshtein距离的上限以及函数在传递时停止。大多数比较应该以该结果结束。
我发现在python中包含一些快速实现的cython / C,例如python-Levenshtein和editdistance,但令我惊讶的是,我发现这些也没有其他我发现可以设置一个上层绑定,我认为这将是基本的。我可以使用所有python实现并修改它,但它会比C实现慢得多。
有没有人知道一个python工具可以允许,或者一种方法来调整实现,以便它会在一些阈值后停止?
由于