我应该用什么方法来预处理scikit中的复杂数据集?

时间:2016-02-10 11:00:40

标签: python-3.x machine-learning dataset scikit-learn

我是堆栈社区的新手,也是数据处理的初学者。我想使用SVM和DT创建预测模型。我想基于我的数据集创建一个模型,但不幸的是我的数据集有点复杂。这是我的数据集的一个例子:

Feature1     Feature2            Feature3   Label
[1,3,9,5]    [612,322,244,466]   [c,s,i,p]  1
[89,23,1,4]  [700,313,444,212]   [c,s,s,i]  -1
...........................................
[103,6,1,2]  [111,232,655,432]   [s,c,s,p]  1

我尝试使用此数据集,但SVM或DT无法创建模型,我收到错误

ValueError: could not convert string to float: "['1','3','5','9']"

我可以用任何方法转换我的数据集,以便用它来构建SVM和DT的预测模型吗?

0 个答案:

没有答案