我在使用tabpy时遇到此问题。我使用样本 - 超软件数据集,我想使用sum([Profit])和sum([Sales])对子类进行聚类,但它返回错误:
ValueError:n_samples = 1应为> = n_clusters = 2。
这是我的剧本:
SCRIPT_str("
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=2)
tmp=[]
for i in range(len(_arg1)):
tmp.extend([[_arg1[i],_arg2[i]]])
KMmodel = kmeans.fit(tmp)
labels = KMmodel.labels_
return labels",
sum([Profit]),sum([Sales]))
答案 0 :(得分:0)
尝试将N-clusters选项更改为1并检查
答案 1 :(得分:0)