如何在SVM中操作多维特征或使用多维特征训练模型?

时间:2018-08-28 09:57:18

标签: python machine-learning scikit-learn svm

如果我输入以下内容:

"a1,b1,c1,d1;A1,B1,C1,D1;α1,β1,γ1,θ1;Label1"  
"... ... "  
"an,bn,cn,dn;An,Bn,Cn,Dn;αn,βn,γn,θn;Labelx"

数组表达式:

[
 [[a1,b1,c1,d1],[A1,B1,C1,D1],[α1,β1,γ1,θ1],[Label1]], 
 ... ... ... ... 
 [[an,bn,cn,dn],[An,Bn,Cn,Dn],[αn,βn,γn,θn],[Labelx]]
                                                     ]

实例:

[... ... ... ...
 [[58.32,453.65,980.50,540.23],[774.40,428.79,1101.96,719.79],[503.70,624.76,1128.00,1064.26],[1]], 
 [[0,0,0,0],[871.05,478.17,1109.37,698.36],[868.63,647.56,1189.92,1040.80],[1]],
 [[169.34,43.41,324.46,187.96],[50.24,37.84,342.39,515.21],[0,0,0,0],[0]]]

赞:
有3个矩形,标签表示相交,包含或其他。
我想使用3个或N个功能通过SVM训练模型。
而且我只是学习了“ python Iris SVM ”代码。我该怎么办?

意见:
这是我的尝试:

from sklearn import svm
import numpy as np
mport matplotlib as mpl
from sklearn.model_selection import train_test_split

def label_type(s):
    it = {b'Situation_1': 0, b'Situation_2': 1, b'Unknown': 2}
    return it[s]


path = 'C:/Users/SEARECLUSE/Desktop/MNIST_DATASET/temp_test.data' 
data = np.loadtxt(path, dtype=list, delimiter=';', converters={3: 
label_type})

x, y = np.split((data), (3,), axis=1)
x = x[:, :3]
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1, 
train_size=0.6)

clf = svm.SVC(C=0.8, kernel='rbf', gamma=20, decision_function_shape='ovr')
clf.fit(x_train, y_train.ravel())

报告错误:

Line: clf.fit(x_train, y_train.ravel())

ValueError: could not convert string to float: 

如果我尝试转换数据:

x, y = np.split(float(data), (3,), axis=1)

报告错误:

Line: x, y = np.split(float(data), (3,), axis=1)

TypeError: only length-1 arrays can be converted to Python scalars

2 个答案:

答案 0 :(得分:0)

在寻求答案之前,我有几个问题:

第一季度。您正在使用哪种数据来训练SVM模型。是图像数据吗?如果是图像数据,是RGB数据吗?您解释数据的方式似乎打算使用SVM进行图像分类。如果我错了,请纠正我。

假设 假设您有图像数据。然后请转换为灰度。然后,您尝试将整个数据转换为numpy数组。检查numpy模块以查找操作方法。

一旦数据成为numpy数组,就可以应用模型。

让我知道是否有帮助。

答案 1 :(得分:0)

SVM最初并非设计用于处理多维数据。我建议您拼合输入功能:

x, y = np.split((data), (3,), axis=1)
x = x[:, :3]

# flatten the features
x = np.reshape(x,(len(x),-1))

x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1, 
train_size=0.6)

clf = svm.SVC(C=0.8, kernel='rbf', gamma=20, decision_function_shape='ovr')
clf.fit(x_train, y_train.ravel())