二进制模式之间的距离

时间:2017-03-27 09:13:15

标签: machine-learning cluster-analysis linear-algebra

我正在研究迷宫模式的聚类,它是0(可用单元格)和1(砖块)的二进制序列。有没有一种很好的方法来定义类似的模式是什么?假设我有两种模式:

1000 and 0100
1000     0100
1000     0100
1111     0111

显然它们是相似的,但我尝试的指标给了我以下结果:Euclidean 2.64575131106;余弦0.537089950114;雅各卡0.7。同时对于绝对不相似的模式,如:

1000 and 1111
1000     0001
1000     0001
1111     0001

它给了我:Euclidean 3.16227766017,Cosine 0.714285714286,Jaccard 0.833333333333。我不喜欢的是数字非常接近。我希望第一种情况为0.1,第二种情况为0.9。有解决方案吗?

0 个答案:

没有答案