如何从csv文件中提取特征和标签以在分类器拟合中使用它们?

时间:2017-09-03 21:37:25

标签: python-3.x machine-learning classification

the photo showing my dataset.csv

上面的照片显示了我的.csv数据。我使用基本代码将数据拆分为训练和测试集80/20,如下面的代码所示。 问题是我不知道如何将数据放入分类器(clf.fit(features,labels))我有三个功能(pdb,pds和pdsh)和三个标签(大,紧凑和小)如何从csv文件中提取它们?

import pandas as pd
import numpy as np

df = pd.read_csv('pd.csv')
df['split'] = np.random.randn(df.shape[0], 1)

splt = np.random.rand(len(df)) <= 0.8

train = df[splt]
test = df[~splt]

#The svm classifier 
from sklearn.metrics import accuracy_score
from sklearn import svm
clf = svm.SVC()
clf.fit(features, labels)
result = clf.predict(featuresT)
print(accuracy_score(TestLabels, result)*100)

任何建议都将受到高度赞赏 谢谢

1 个答案:

答案 0 :(得分:0)

请在互联网上搜索您的问题,因为有可用的解决方案。我还在写一篇。

首先,标签应转换为数字0,1,2。

当您使用pandas时,您可以通过 label = df [&#39; Name&#39;] 提取标签。但现在你必须从列车和测试数据集中删除目标列。

删除列使用:

train = train.drop([&#39;名称&#39;],轴= 1)

test = test.drop([&#39;名称&#39;],轴= 1)