在python中设置Levenshtein(编辑)距离的上限

时间:2017-12-20 10:21:43

标签: python levenshtein-distance edit-distance

我需要计算DNA序列之间的编辑距离,以便将相似的序列组合在一起。如果序列的距离大于某个阈值,则它们被认为是不同的,我不关心实际值是什么,所以我自然希望设置Levenshtein距离的上限以及函数在传递时停止。大多数比较应该以该结果结束。

我发现在python中包含一些快速实现的cython / C,例如python-Levenshteineditdistance,但令我惊讶的是,我发现这些也没有其他我发现可以设置一个上层绑定,我认为这将是基本的。我可以使用所有python实现并修改它,但它会比C实现慢得多。

有没有人知道一个python工具可以允许,或者一种方法来调整实现,以便它会在一些阈值后停止?

由于

0 个答案:

没有答案