标签: cluster-analysis k-means
我有一个顺序数据(每次一个实例)将被分为两个类。我想使用K-means的顺序版本(顺序K-means)。
在开始时为算法随机指定两个聚类的中心时,我希望它们之间的距离尽可能最大(即彼此相距很远),以便将所得两个聚类的分布不会受到初始中心的影响。
我的想法正确吗?如果是这样,我该怎么办?
答案 0 :(得分:0)
而是尽可能地最好地估计真实的意思。那是最佳选择。
如果只想将它们分开,可能会导致它们之间的分配点错误。