比较和可视化序列组

时间:2012-09-15 09:52:46

标签: string matlab sequence markov-chains edit-distance

我有两组 A B 字母“AGTE”的字符串,我想找到一些比较这些的方法来看看它们是否具有统计学意义类似。第一组A是现实世界观测,B是预测。每组有400左右

**A**
GTAATEGTTTEAAA
TTEAGE
...

**B**
AGTEAAAAGT
TAT
GGATEAATGGGTEAATG
....

我还想以某种方式将这些视觉化,以用于演示目的。你有什么想法我能做到吗?

1 个答案:

答案 0 :(得分:1)

我建议您计算字符串之间的Levenshtein distance,然后您可以绘制这些字符串间的距离。较大的值表示更不相似的字符串。

如果您不想自己实施Levenshtein距离计算,请在文件交换中查看these submissions