我正在尝试在熊猫数据帧上实现决策树回归算法。功能之一是一个numpy数组。这是一个模拟示例:
data2 = {
'name':['firstium','secondium'],
'vec': [np.array([2, 3, 4, 0, 0, 0]),np.array([2, 0, 0, 1, 0, 3])],
'hardness':[2.5,2.4],
'refractive index':[1.9,1.0]
}
frame2=pd.DataFrame(data2,columns=['name','vec','hardness','refractive index'])
name vec hardness refractive index
0 firstium [2, 3, 4, 0, 0, 0] 2.5 1.9
1 secondium [2, 0, 0, 1, 0, 3] 2.4 1.0
当我实现DecisionTreeRegressor时:
from sklearn.tree import DecisionTreeRegressor
tree_reg=DecisionTreeRegressor()
tree_reg.fit(frame2['vec'],frame2['hardness'])
我收到以下错误消息:
ValueError: setting an array element with a sequence.
我可以将此数组转换为单个值的列,但是在此过程中会丢失一些信息。有没有一种方法可以将整个数组作为一个功能提供?
谢谢!