我正在研究迷宫模式的聚类,它是0(可用单元格)和1(砖块)的二进制序列。有没有一种很好的方法来定义类似的模式是什么?假设我有两种模式:
1000 and 0100
1000 0100
1000 0100
1111 0111
显然它们是相似的,但我尝试的指标给了我以下结果:Euclidean 2.64575131106;余弦0.537089950114;雅各卡0.7。同时对于绝对不相似的模式,如:
1000 and 1111
1000 0001
1000 0001
1111 0001
它给了我:Euclidean 3.16227766017,Cosine 0.714285714286,Jaccard 0.833333333333。我不喜欢的是数字非常接近。我希望第一种情况为0.1,第二种情况为0.9。有解决方案吗?