我有一个数据列,其中有一个列data1['State']
。我想使用LabelEncoder
和OneHotEncoder
将分类值转换为数字。
**State**
New York
California
New York
Chicago
Chicago
California
London
我正在使用以下代码:
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
data1[:, 2] = labelencoder.fit_transform(data1[:, 2])
由于我的数据框仅包含3个变量,所以State列是最后一列。
运行上面的代码后出现以下错误:
could not convert string to float: 'California'