如何使用k-means聚类对MNIST数据集进行分类?

时间:2016-06-15 17:19:16

标签: machine-learning cluster-analysis deep-learning

我在MNIST数据集上应用K-Means聚类。然后我如何根据这个来预测我的测试集的值?

1 个答案:

答案 0 :(得分:3)

k-means是一种无监督的技术,所以从技术上讲你不会用它来“分类” - 也就是说,k-means模型没有提供带标签的数据(如果它不是使用类标签)以及更多,因此它不会将预测作为类标签返回(例如,“1”)

所以使用k-means来预测给定数据实例中编码的单个数字:

  • 你的k-means模型由一组 质心 组成(我假设 你选择了26个质心来对应基数10中的数字0 - 9

  • 每个质心代表一个星团的几何中心 - 一个 每个数字的集群

  • 计算成对欧几里德距离(向量范数) 您的未知数据点和k-means模型中的每个质心( 最后一次迭代的质心值,很明显)

  • 其中心距离最小距离的群集 未知数据点是未知数据指向的集群 属于