sklearn kmeans预测样本大小的ValueError

时间:2016-11-03 01:36:37

标签: python numpy scikit-learn k-means

我已经训练了我的KMeans模型

clf = KMeans( n_clusters = num_clusters )
km = clf.fit_predict(model.docvecs)

其中model.docvecs是200个numpy数组的维度100的列表。

例如

len(model.docvecs) = 200
len(model.docvecs[0] = 100

    model.docvecs:
    [[ -3.97457965e-02   9.68865305e-03  -3.20274942e-02  -5.41459583e-03
       6.67170063e-02   9.20293033e-02   3.16953734e-02  -2.13479511e-02
       1.87820643e-02  -2.44720243e-02   2.16792207e-02  -2.09533237e-02..]
    [ -3.97457965e-02   9.68865305e-03  -3.20274942e-02  -5.41459583e-03
       6.67170063e-02   9.20293033e-02   3.16953734e-02  -2.13479511e-02
       1.87820643e-02  -2.44720243e-02   2.16792207e-02  -2.09533237e-02..]..]

现在我想预测单个向量属于哪个群集。 new_vec是一个100维向量 - 就像其他向量一样。

new_vec = [ -3.97457965e-02   9.68865305e-03  -3.20274942e-02  -5.41459583e-03
       6.67170063e-02   9.20293033e-02   3.16953734e-02  -2.13479511e-02
       1.87820643e-02  -2.44720243e-02   2.16792207e-02  -2.09533237e-02..]

我的代码:

km.fit(new_vec.reshape(1,-1))

这是我的错误:

--> 789                 X.shape[0], self.n_clusters))
    790         return X
    791 

ValueError: n_samples=1 should be >= n_clusters=100

似乎无法弄清楚

0 个答案:

没有答案