标签: bigdata data-mining k-means unsupervised-learning
我有一个包含200万个样本的数据集。 我想用k-means将这个数据集聚类成2000个簇。 是否可以使用此数据大小的此数量的群集。
注意:每个样本的特征向量大小为1000
答案 0 :(得分:0)
要预测算法的运行时间,您可以查看它的时间复杂度。这是一个将运行时间与某些参数相关联的公式,例如数据点和k-means中的簇数。有关k-means聚类中时间复杂度的信息,请访问:Computational complexity of k-means