我尝试使用模糊c均值(FCM)方法将文档聚类为2个聚类,并使用余弦相似度而不是欧式距离进行距离测量。就最近的知识而言,余弦相似度用于评估文档之间的相似度,但是根据我阅读的期刊论文,FCM需要进行距离测量,因此使用余弦距离方法进行测量,其计算公式如下:
Cosine Similarity formula : Cosine Distance formula :
注意:d为文档
我想问的是,您如何使用余弦距离公式测量数据和质心之间的距离?
当我们将距离的测量值更改为余弦距离时,隶属度的计算是否保持不变(仍使用功率(-2 / w-1))?
非常感谢您!