使用机器学习来预测数据

时间:2016-05-24 20:33:22

标签: python python-3.x machine-learning prediction

我想使用机器学习来制作模型,该模型可以预测给定日期的注册数量。我有一个训练集,其中包含日期,注册次数以及一些其他可能对训练此分类器有用的变量/特征。此外,每30天this trend可见。

最终,我想要这样的东西(使用Python):

exampledata = [({'date':'01-01-2016','day': 'friday', 'holiday': True, 'etc': 0.3}, 20), ({'date':'02-01-2016','day': 'saturday', 'holiday': False, 'etc': 0.3}, 25),({'date':'03-01-2016','day': 'sunday', 'holiday': False, 'etc': 0.4}, 40)]
classifier.train(exampledata)
classifier.predict("04-01-2016")
>>> 30

我找到了Scikit的支持向量分类方法,但我不确定如何使用我的数据。

我如何开始?如果需要更多信息,请告诉我。

1 个答案:

答案 0 :(得分:2)

这可能不是一个令人满意的答案...... 首先,您必须选择一组要用于训练分类器的属性。然后,您必须选择要学习的分类器模型。并且您最终必须提供训练集,测试集和验证集,它们都是原始集的子集。许多技术允许选择模型及其参数,以便在已经学习和测试所有结果的情况下给出预测的最佳(或最差)结果。

我的建议是使用scikit-learn(http://scikit-learn.org/stable/)并花时间访问其教程:http://scikit-learn.org/stable/tutorial/。你会发现有很多有用的信息应该有所帮助。在学习预测模型时,如何提供培训项目及其预期结果。