the photo showing my dataset.csv
上面的照片显示了我的.csv数据。我使用基本代码将数据拆分为训练和测试集80/20,如下面的代码所示。 问题是我不知道如何将数据放入分类器(clf.fit(features,labels))我有三个功能(pdb,pds和pdsh)和三个标签(大,紧凑和小)如何从csv文件中提取它们?
import pandas as pd
import numpy as np
df = pd.read_csv('pd.csv')
df['split'] = np.random.randn(df.shape[0], 1)
splt = np.random.rand(len(df)) <= 0.8
train = df[splt]
test = df[~splt]
#The svm classifier
from sklearn.metrics import accuracy_score
from sklearn import svm
clf = svm.SVC()
clf.fit(features, labels)
result = clf.predict(featuresT)
print(accuracy_score(TestLabels, result)*100)
任何建议都将受到高度赞赏 谢谢
答案 0 :(得分:0)
请在互联网上搜索您的问题,因为有可用的解决方案。我还在写一篇。
首先,标签应转换为数字0,1,2。
当您使用pandas时,您可以通过 label = df [&#39; Name&#39;] 提取标签。但现在你必须从列车和测试数据集中删除目标列。
删除列使用:
train = train.drop([&#39;名称&#39;],轴= 1)
test = test.drop([&#39;名称&#39;],轴= 1)