在Sklearn中,为了训练数据的字典,我有从原始字典转换而来的全长向量,例如[1,0,0,0,0]。 (使用DictVectorizer和fit_transform。)
vec = DictVectorizer(sparse=True)
data = vec.fit_transform(dict_list)
但是,在测试数据中,由于样本数量有限,我没有从dict转换为全长向量,例如[0,0,0,1]。
这些是否有帮助,可以自动为缺失的矢量列(为0)填写测试数据?
答案 0 :(得分:0)
在测试方面,您要做的就是:
test_data = vec.transform(test_dict_list)