machine-learning - 如何使用k-means聚类对MNIST数据集进行分类？ - Thinbug

如何使用k-means聚类对MNIST数据集进行分类？

时间：2016-06-15 17:19:16

标签： machine-learning cluster-analysis deep-learning

我在MNIST数据集上应用K-Means聚类。然后我如何根据这个来预测我的测试集的值？

1 个答案:

答案 0 :(得分：3)

k-means是一种无监督的技术，所以从技术上讲你不会用它来“分类” - 也就是说，k-means模型没有提供带标签的数据（如果它不是使用类标签）以及更多，因此它不会将预测作为类标签返回（例如，“1”）

所以使用k-means来预测给定数据实例中编码的单个数字：

你的k-means模型由一组质心组成（我假设你选择了26个质心来对应基数10中的数字0 - 9
每个质心代表一个星团的几何中心 - 一个每个数字的集群
计算成对欧几里德距离（向量范数）您的未知数据点和k-means模型中的每个质心（最后一次迭代的质心值，很明显）
其中心距离最小距离的群集未知数据点是未知数据指向的集群属于