fuzzy c-means可以应用于非数值数据集吗?即分类或混合数字和分类.. 如果是的话(我希望如此:():
如果否,那么替代方案..如何模糊聚类这些数据?
我需要回复请帮助
注意:我已经使用雅加德系数来计算2点之间的距离,但仍无法计算聚类中心,请参阅附件
答案 0 :(得分:4)
您必须将数据转换为数字形式。有多种方法可以做到这一点,其中两种方式是:
两者都是非常常见的转换,很多机器学习程序都是在幕后进行的。此外,您可能希望尝试使用与欧几里德不同的度量标准。 ESP。使用单热表示,但根据数据,L1标准(曼哈顿/城市街区距离)可能更合适。
除此之外,只需将给定的公式应用于转换的数据集。