我正在做一个kmeans聚类来分析我的数据。到目前为止它的工作完美。 到目前为止,这是我的代码:
library(Ckmeans.1d.dp)
file=read.csv(file.choose(),header=T)
attach(file)
sortfile=file[order(normalized),]
results=Ckmeans.1d.dp(normalized,3)
plot(results)
现在,我能够获得群集和中心,但我更有兴趣获得"限制"集群不是我使用的数据中一个集群中的最大值,而是我现在拥有的集群的限制。那可能吗?我怎么能这样做?
答案 0 :(得分:2)
K-Means根据最近的质心(聚类中心)标记点。因此,聚类之间的“限制”(称为决策边界)是至少有两个不同质心作为其最近质心的点(例如,与它们具有完全相同的距离)。
例如在2D中,对于平面中的每个点,计算它最接近的质心。如果它有多个(例如,至少两个质心与它的距离最小),那么它就是决策边界的一部分。