应用错误收集

k点，数据维数和数据大小（数百万个样本）是否存在k均值限制

时间：2018-02-27 06:47:55

标签： bigdata data-mining k-means unsupervised-learning

我有一个包含200万个样本的数据集。我想用k-means将这个数据集聚类成2000个簇。是否可以使用此数据大小的此数量的群集。

注意：每个样本的特征向量大小为1000

1 个答案:

答案 0 :(得分：0)

要预测算法的运行时间，您可以查看它的时间复杂度。这是一个将运行时间与某些参数相关联的公式，例如数据点和k-means中的簇数。有关k-means聚类中时间复杂度的信息，请访问：Computational complexity of k-means