标签: python matlab
我正在尝试分离一个数据集,该数据集具有两个完全不重叠的群集以及一个远离这两个群集的数据点。
当我使用kmeans()获取2个群集时,它将“有效”群集之一分成两半,并将单个数据点视为一个单独的群集。
有没有办法为此指定最小点数?我正在使用MATLAB。
答案 0 :(得分:0)
有几种解决方案:
可以在交叉验证的网站上找到有关k均值行为不足的更多解释(例如,参见here)。