因此,我正在使用对象类型功能,并且首先估算出缺少的值。然后我给它们加上标签,然后OneHot对它们进行编码,最后得到一个新的熊猫数据帧,该数据帧现在有260个(它有43个)。 这是代码:
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import OrdinalEncoder
o_encoder = OrdinalEncoder()
one_hot = OneHotEncoder()
encoded_object_train_data = o_encoder.fit_transform(raw_object_train_data)
encoded_object_train_data = one_hot.fit_transform(encoded_object_train_data).toarray()
object_data = pd.DataFrame(data=encoded_object_train_data)
object_labels = raw_train_data['SalePrice']
object_data
我了解OneHot和标签的工作原理,但是现在我的df列名称只是range(261)数字,问题是我现在如何找到相关性?代码不应该将来自同一功能的功能归为一组并将它们关联为一个功能吗?我的列名不应该只是纯数字吗?我对如何继续感到困惑。