我正在尝试使用scikit-learn来使用SVM,但无法获得我期望的结果。我想使用k-means对大约2-5个数据集群进行分类,然后使用SVM为该数据构建模型,为此我可以使用更新的数据来实时预测/分类。这对我来说不起作用,所以我尝试手动将标签,500个样本和3个分类数据簇给予SVM。无论我尝试使用SVM预测的随机数据,我总是得到相同的预测值'1'。什么在tarnation正在发生......
# Attempting 3 clusters: 500 training samples in asarray (x-y coordinate data)
clf = svm.SVC(kernel = 'rbf', C=1, gamma = 1)
clf.fit(asarray,labels)
realData = [[-0.005, -0.01], [-0.005, -0.024], [-0.0075, -0.01], [-0.007, -0.008]]
print(clf.predict(realData))
# output: [1 1 1 1]
请记住这一点......我只有几周的python经验,并且仍然只有许多机器学习主题的一般知识基础。
编辑:asarray&的示例数据集标签
asarray:
[[-0.001, -0.008]
[-0.0055, -0.0236]
[-0.007, -0.0221]
...
[-0.008, -0.01]
[-0.0062, -0.015]
[-0.0025, -0.009]]
标签:
[0 2 2 ... 1 1 0]
我不想列出所有500个数据元素,所以我写了一个非常相似的样本。