k点,数据维数和数据大小(数百万个样本)是否存在k均值限制

时间:2018-02-27 06:47:55

标签: bigdata data-mining k-means unsupervised-learning

我有一个包含200万个样本的数据集。 我想用k-means将这个数据集聚类成2000个簇。 是否可以使用此数据大小的此数量的群集。

注意:每个样本的特征向量大小为1000

1 个答案:

答案 0 :(得分:0)

要预测算法的运行时间,您可以查看它的时间复杂度。这是一个将运行时间与某些参数相关联的公式,例如数据点和k-means中的簇数。有关k-means聚类中时间复杂度的信息,请访问:Computational complexity of k-means