在sklearn中对分类变量使用onehotencoding时,如何使用稀疏矩阵生成以及其他数值变量来拟合决策树? 如果我使用OneHotEncoding将分类变量转换为稀疏矩阵,那么我如何将这个稀疏矩阵与原始数据集中的数值变量结合起来呢?
答案 0 :(得分:0)
使用:
categorical_features
索引要编码的功能(自动组合所有功能)
transform
)如果您没有更改sparse=True
scipy.sparse.hstack((onehot, original))
onehot
的形状为(n_samples, ?
(取决于您的特征),而original
的形状为(n_samples, ?