我正在尝试计算输入字符串和给定字符串集合之间的百分比相似度。我见过使用汉明距离和levenshtein距离的例子。但这些只考虑了两个问题。
我的问题:可以一次计算多次蜇伤的上述内容吗? (我有一组存储的字符串,我得到一个新的输入刺痛,我想知道新的刺痛是多么相似,或者匹配的刺痛是90%)。我相信汉明的距离是合适的,因为所有的弦都是相同的长度。
例如:假设输入:A T T A C G C T
Existing: A A T T G T C
A C T T G T C
C A T T G T C
虽然有许多类似的问题得到了回答,但我还是找不到考虑到这一点的问题。也许有人可以提供帮助。
提前致谢!