我有两组 A 和 B 字母“AGTE”的字符串,我想找到一些比较这些的方法来看看它们是否具有统计学意义类似。第一组A是现实世界观测,B是预测。每组有400左右
**A**
GTAATEGTTTEAAA
TTEAGE
...
**B**
AGTEAAAAGT
TAT
GGATEAATGGGTEAATG
....
我还想以某种方式将这些视觉化,以用于演示目的。你有什么想法我能做到吗?
答案 0 :(得分:1)
我建议您计算字符串之间的Levenshtein distance,然后您可以绘制这些字符串间的距离。较大的值表示更不相似的字符串。
如果您不想自己实施Levenshtein距离计算,请在文件交换中查看these submissions。