如何使用汉明距离校正字符串(字符)错误?

时间:2019-05-17 13:20:47

标签: python jupyter-notebook hamming-distance difflib hamming-code

如何使用汉明距离校正字符串(字符)错误?我已经阅读了许多有关汉明距离的文章,其中说汉明距离可以进行纠错,并且在纠正二进制数方面我看到了很多示例,但是都没有显示如何将其与字符纠正一起使用。

我有一个正确的数据列表和另一个损坏的数据列表,我想使用汉明距离将损坏的数据与正确的数据进行比较,以尝试更正(修复)损坏的数据,例如:

如果我有损坏的字符串UE*GS5,则应将其与格式正确的UESGS5的正确数据列表进行比较,然后更正损坏的字符串并将其添加到正确的数据列表中。我发现汉明距离的唯一代码是

def hamming_distance(s1, s2):
    return sum(ch1 != ch2 for ch1,ch2 in zip(s1,s2))

我还想知道difflib是否可以帮助纠错?

非常感谢

0 个答案:

没有答案