我正在研究k-means algorythm,它目前正在运行,但我正在寻找另一个使用额外因子的公式,即2个向量中的1个点的相关性我计算它们之间的距离
到目前为止我正在做的总结:
我为数据库中的条目分配了一个向量,并使用k-means将所有条目分配给一个集群。然后,我检查附近聚类的随机点,并收集比某个因子更近的条目。
这一切都有效,在集群完成后,我可以选择一个随机的新点并收集其中最近的集群和数据库条目。然而,我仍然必须确定这些条目的相关性,我想通过在此之后使用距离计算的因子来做到这一点。
基本上我必须计算点X和多点C(n)之间的距离 所有点都是3D矢量
D(n)= SQRT((X1-C1)²+(X2-C2)²+(X3-C3)²)
我想要的是在C中的每个点内的额外因素,如果匹配则使距离更短并且如果它根本不匹配则使其更大。相关性为0表示根本不相关,然后为1 2或3表示非常相关。基本上,如果C1是相关性3且X1不相同,则距离应该更大但是如果X1 == C1,则距离应该是最小的,因为具有相关性3的C1计数比C2更强,而C3具有相关性1,例如。
我希望我能说清楚,有人可以帮助我:)