使用numpy数组作为决策树回归器中的功能

时间:2018-06-19 15:55:04

标签: numpy machine-learning decision-tree

我正在尝试在熊猫数据帧上实现决策树回归算法。功能之一是一个numpy数组。这是一个模拟示例:

data2 = {
'name':['firstium','secondium'],
'vec': [np.array([2, 3, 4, 0, 0, 0]),np.array([2, 0, 0, 1, 0, 3])],
'hardness':[2.5,2.4],
'refractive index':[1.9,1.0]
}

frame2=pd.DataFrame(data2,columns=['name','vec','hardness','refractive index'])


     name       vec                hardness refractive index
0   firstium    [2, 3, 4, 0, 0, 0]      2.5       1.9
1   secondium   [2, 0, 0, 1, 0, 3]      2.4       1.0

当我实现DecisionTreeRegressor时:

 from sklearn.tree import DecisionTreeRegressor
 tree_reg=DecisionTreeRegressor()
 tree_reg.fit(frame2['vec'],frame2['hardness'])

我收到以下错误消息:

 ValueError: setting an array element with a sequence.

我可以将此数组转换为单个值的列,但是在此过程中会丢失一些信息。有没有一种方法可以将整个数组作为一个功能提供?

谢谢!

0 个答案:

没有答案