Question

我想使用机器学习来制作模型，该模型可以预测给定日期的注册数量。我有一个训练集，其中包含日期，注册次数以及一些其他可能对训练此分类器有用的变量/特征。此外，每30天this trend可见。

最终，我想要这样的东西（使用Python）：

exampledata = [({'date':'01-01-2016','day': 'friday', 'holiday': True, 'etc': 0.3}, 20), ({'date':'02-01-2016','day': 'saturday', 'holiday': False, 'etc': 0.3}, 25),({'date':'03-01-2016','day': 'sunday', 'holiday': False, 'etc': 0.4}, 40)]
classifier.train(exampledata)
classifier.predict("04-01-2016")
>>> 30

我找到了Scikit的支持向量分类方法，但我不确定如何使用我的数据。

我如何开始？如果需要更多信息，请告诉我。

Answer 1

这可能不是一个令人满意的答案...... 首先，您必须选择一组要用于训练分类器的属性。然后，您必须选择要学习的分类器模型。并且您最终必须提供训练集，测试集和验证集，它们都是原始集的子集。许多技术允许选择模型及其参数，以便在已经学习和测试所有结果的情况下给出预测的最佳（或最差）结果。

我的建议是使用scikit-learn（http://scikit-learn.org/stable/）并花时间访问其教程：http://scikit-learn.org/stable/tutorial/。你会发现有很多有用的信息应该有所帮助。在学习预测模型时，如何提供培训项目及其预期结果。

使用机器学习来预测数据

1 个答案: