我已经训练了我的KMeans模型
clf = KMeans( n_clusters = num_clusters )
km = clf.fit_predict(model.docvecs)
其中model.docvecs是200个numpy数组的维度100的列表。
例如
len(model.docvecs) = 200
len(model.docvecs[0] = 100
model.docvecs:
[[ -3.97457965e-02 9.68865305e-03 -3.20274942e-02 -5.41459583e-03
6.67170063e-02 9.20293033e-02 3.16953734e-02 -2.13479511e-02
1.87820643e-02 -2.44720243e-02 2.16792207e-02 -2.09533237e-02..]
[ -3.97457965e-02 9.68865305e-03 -3.20274942e-02 -5.41459583e-03
6.67170063e-02 9.20293033e-02 3.16953734e-02 -2.13479511e-02
1.87820643e-02 -2.44720243e-02 2.16792207e-02 -2.09533237e-02..]..]
现在我想预测单个向量属于哪个群集。 new_vec是一个100维向量 - 就像其他向量一样。
new_vec = [ -3.97457965e-02 9.68865305e-03 -3.20274942e-02 -5.41459583e-03
6.67170063e-02 9.20293033e-02 3.16953734e-02 -2.13479511e-02
1.87820643e-02 -2.44720243e-02 2.16792207e-02 -2.09533237e-02..]
我的代码:
km.fit(new_vec.reshape(1,-1))
这是我的错误:
--> 789 X.shape[0], self.n_clusters))
790 return X
791
ValueError: n_samples=1 should be >= n_clusters=100
似乎无法弄清楚