从熊猫数据帧转换为sklearn线性回归后如何使用矢量化数据?

时间:2019-12-03 15:28:16

标签: python pandas scikit-learn dictvectorizer

我正在将一个数据帧转换为dict,并使用它来向量化我的字符串列:

from sklearn.feature_extraction import DictVectorizer
vec = DictVectorizer(sparse=False, dtype=int)
vec.fit_transform(data.T.to_dict().values())
vec.get_feature_names()

结果:

Roof Style=Hip',
 'Roof Style=Mansard',
 'Roof Style=Shed',
 'Sale Condition=Abnorml',
 'Sale Condition=AdjLand',
 'Sale Condition=Alloca',
 'Sale Condition=Family',
 'Sale Condition=Normal',
 'Sale Condition=Partial',

如何使用sklearn将信息再次放入带有标题的数据帧中,以便在我的线性回归代码中使用?

0 个答案:

没有答案