在DictVectorizer和fit_transform之后自动填充测试数据

时间:2018-12-04 22:22:52

标签: machine-learning scikit-learn

在Sklearn中,为了训练数据的字典,我有从原始字典转换而来的全长向量,例如[1,0,0,0,0]。 (使用DictVectorizer和fit_transform。)

vec = DictVectorizer(sparse=True)
data = vec.fit_transform(dict_list)

但是,在测试数据中,由于样本数量有限,我没有从dict转换为全长向量,例如[0,0,0,1]。

这些是否有帮助,可以自动为缺失的矢量列(为0)填写测试数据?

1 个答案:

答案 0 :(得分:0)

在测试方面,您要做的就是:

test_data = vec.transform(test_dict_list)