Question

在Sklearn中，为了训练数据的字典，我有从原始字典转换而来的全长向量，例如[1,0,0,0,0]。（使用DictVectorizer和fit_transform。）

vec = DictVectorizer(sparse=True)
data = vec.fit_transform(dict_list)

但是，在测试数据中，由于样本数量有限，我没有从dict转换为全长向量，例如[0,0,0,1]。

这些是否有帮助，可以自动为缺失的矢量列（为0）填写测试数据？

Answer 1

在测试方面，您要做的就是：

test_data = vec.transform(test_dict_list)