一组字符串之间的百分比相似度

时间:2014-11-17 14:33:16

标签: php sql

我正在尝试计算输入字符串和给定字符串集合之间的百分比相似度。我见过使用汉明距离和levenshtein距离的例子。但这些只考虑了两个问题。

我的问题:可以一次计算多次蜇伤的上述内容吗? (我有一组存储的字符串,我得到一个新的输入刺痛,我想知道新的刺痛是多么相似,或者匹配的刺痛是90%)。我相信汉明的距离是合适的,因为所有的弦都是相同的长度。

例如:假设输入:A T T A C G C T

         Existing: A A T T G T C
                   A C T T G T C
                   C A T T G T C

虽然有许多类似的问题得到了回答,但我还是找不到考虑到这一点的问题。也许有人可以提供帮助。

提前致谢!

1 个答案:

答案 0 :(得分:0)

您可以使用:levenshtein

检查文档以获得示例,希望它对您有帮助。