从sklearn设置k_means的簇大小

时间:2017-12-08 13:51:43

标签: python machine-learning scikit-learn

我正在使用 sklearn.cluster.k_means 为图像进行聚类。问题是每个集群由10个几乎相同的图像组成,因此我想在调用sklearn函数时为每个集群设置一个set(max?)大小,但是我无法找到解决问题的任何方法。

8张图片的示例输入:

enter image description here

输入是图像哈希的数组,因此,例如,如果我们有8张图片,则数组是大小(8,16)。它目前适用于任何大小,但输出略有错误(如95%正确),因为它有时会在其中一个群集中放置第11个视频(这也意味着只有9个群集)。

示例输出:

enter image description here

输出只是图像所属的质心的整数。

如果您对如何解决这个问题有所了解,或者如果有更好的方法而不是k意味着可以更容易地支持这一点,那么我全都听见了。

编辑:添加输入和输出的样本作为图像。

0 个答案:

没有答案