我在MNIST数据集上应用K-Means聚类。然后我如何根据这个来预测我的测试集的值?
答案 0 :(得分:3)
k-means是一种无监督的技术,所以从技术上讲你不会用它来“分类” - 也就是说,k-means模型没有提供带标签的数据(如果它不是使用类标签)以及更多,因此它不会将预测作为类标签返回(例如,“1”)
所以使用k-means来预测给定数据实例中编码的单个数字:
你的k-means模型由一组 质心 组成(我假设 你选择了26个质心来对应基数10中的数字0 - 9
每个质心代表一个星团的几何中心 - 一个 每个数字的集群
计算成对欧几里德距离(向量范数) 您的未知数据点和k-means模型中的每个质心( 最后一次迭代的质心值,很明显)
其中心距离最小距离的群集 未知数据点是未知数据指向的集群 属于