应用错误收集

k表示R中的许多相同点

时间：2016-03-28 20:54:55

标签： r k-means

假设我有一个一维数据集，其中包含许多相同的数字，例如数据集S = c(rep(4, times(1000)), rep(5, times(808)), rep(9, times(990)))。在R中有没有有效的方法来做k-means？实际上在我的数据中我只有大约20个不同的点，但每个点出现大约100000次，运行速度非常慢。所以我想知道是否有更有效的方式。

1 个答案:

答案 0 :(得分：0)

K-means可以用权重来实现。这样做很简单。

但是IIRC包含的版本没有以这种方式实现。 flexcluster 上的版本可能是，但它是纯粹的R而且要慢得多。

无论哪种方式，您都希望在Fortran或C中实现此功能，就像常规的kmeans版本一样。也许你可以找到一些已经很好实现的软件包。

k-means：每次执行都有相同的簇
K-means和顺序K-means的结果相同？
K表示聚类在java中找到k个最远点
k-means聚类 - 为什么所有相同的聚类？
在R中可视化集群的K表示
为新数据点预测球形k-Means聚类
Scree Plot用于确定K均值中的K.
k表示R中的许多相同点
绘制K均值

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？