预测未知数字的值

时间:2016-12-14 17:36:28

标签: python machine-learning scikit-learn prediction missing-data

我有一个训练数据集,由14个由空格分隔的整数组成。每个数字是1(一)或2(两)。第i个数字可以理解为存在相应的特征。一个意味着错误,两个意味着真实。训练数据集如下所示:

1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 2 1 1 1 1 1 1 1
1 2 1 2 1 1 2 1 1 1 1 1 1 1
1 2 1 2 1 1 2 1 1 1 1 1 1 1
1 2 1 2 1 1 2 1 1 1 1 1 1 1
1 2 1 2 1 1 2 1 1 1 1 1 1 1

测试数据集包含10000行,表示缺少某些数据的样本。这由零表示,每行一个。测试数据如下所示:

1 1 1 1 1 1 1 1 1 1 1 1 0 1
0 2 1 2 1 1 2 1 1 1 1 1 1 1
1 2 1 0 1 1 2 1 1 1 1 1 1 1
1 1 1 1 1 1 0 1 1 1 1 1 1 1
2 2 2 0 1 1 2 1 1 1 1 1 1 1

我对机器学习很新,我想知道一种预测那些缺失值的方法。我知道在scikit中学习有一个类调用Imputer,它允许你找到那些缺失的值。但它不使用任何列车数据。如果有人可以给我一些解决这个问题的点数,那就太棒了

0 个答案:

没有答案