我正在将一个数据帧转换为dict,并使用它来向量化我的字符串列:
from sklearn.feature_extraction import DictVectorizer
vec = DictVectorizer(sparse=False, dtype=int)
vec.fit_transform(data.T.to_dict().values())
vec.get_feature_names()
结果:
Roof Style=Hip',
'Roof Style=Mansard',
'Roof Style=Shed',
'Sale Condition=Abnorml',
'Sale Condition=AdjLand',
'Sale Condition=Alloca',
'Sale Condition=Family',
'Sale Condition=Normal',
'Sale Condition=Partial',
如何使用sklearn将信息再次放入带有标题的数据帧中,以便在我的线性回归代码中使用?