我是Python和机器学习的新手。我在网上找到了一个同时包含Arduino和Python的项目,因此决定尝试一下。该项目的github链接为here btw。 Arduino部分已经可以使用了,我已经可以将数据写入csv文件了。我正在尝试将csv文件中的数据插入svm中的训练中。但是,我无法通过培训。代码如下。
import numpy as np
import csv
from sklearn import svm
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
import pandas as pd
dataframe= pd.read_csv("csvdata.csv", delimiter=',')
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size = 0.2)
train_features = train[['LABEL','F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]
train_label = train.values
test_features = test[['LABEL','F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]
test_label = test.values
## SVM
model = svm.SVC(kernel='linear', gamma=1, C=1)
model.fit(train_features, train_label)
每当我运行代码时,我都会在最后一行偶然发现此错误:
Traceback (most recent call last):
File "C:\Python27\projects\practice\modeling.py", line 32, in <module>
model.fit(train_features, train_label)
File "C:\Python27\lib\site-packages\sklearn\svm\base.py", line 149, in fit
accept_large_sparse=False)
File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 761, in check_X_y
y = column_or_1d(y, warn=True)
File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 797, in column_or_1d
raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (11, 11)
我真的很困惑,我不知道该怎么办了。我不知道标签和功能以及通过csv进行培训的方式。我已经研究了通过在Python脚本中手动插入数据来进行训练的方法,并且它们可以工作,但是我发现csv的训练方法没有解决方案。
这是csv文件的内容
F1,F2,F3,F4,F5,X,Y,Z,C1,C2
525, 505, 544, 557, 545, 1268, -8264, 14888, 1, 1
523, 505, 544, 557, 545, 1480, -8320, 14684, 1, 1
517, 505, 544, 557, 544, 1460, -8352, 14712, 1, 1
524, 505, 544, 557, 545, 1436, -8312, 14496, 1, 1
568, 506, 544, 557, 544, 1308, -8348, 14744, 1, 1
578, 506, 544, 557, 544, 1128, -8484, 14376, 1, 1
583, 506, 544, 557, 545, 1376, -8180, 14768, 1, 1
583, 505, 544, 557, 545, 1380, -8220, 14636, 1, 1
550, 505, 544, 557, 544, 1332, -8376, 14700, 1, 1
510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1
510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1
510, 505, 544, 557, 545, 1412, -8320, 14620, 1, 1
我希望有人能够帮助到现在,我想找出答案。谢谢。
答案 0 :(得分:1)
您应该在model.fit
中传递要素和标签;但是按原样(train_label = train.values
),您最终得到的功能和标签本质上是同一件事。标签应该是一维的(在错误消息中您可以看到y = column_or_1d
),并且肯定不是您功能的一部分。
您应按以下步骤更改功能和标签定义:
train_features = train[['F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]
train_label = train['LABEL']
test_features = test[['F1','F2','F3','F4','F5','X','Y','Z','C1','C2']]
test_label = test['LABEL']
如果您的model.fit
无法正常工作,请尝试:
model.fit(train_features.values, train_label.values)