使用机器学习预测

时间:2012-11-28 12:48:17

标签: statistics machine-learning regression svm decision-tree

假设我有过去5年的一些数据,并且我已根据该数据训练了我的分类器(任何决策树,svm等),即给定适当的输入要素数据和正确的输出标记。

现在,当我必须进行预测(预测输出)时,我可以提供当前年份的输入要素数据,分类器将预测正确的输出标签。

到目前为止一切顺利。

但是假设如果我没有当前的输入要素数据,我该如何根据过去的数据进行预测呢?

举例选举预测,即哪一方将从每个选区获胜。在这里我们有很多过去的数据但没有当前的输入要素数据,那么如何解决这个问题呢?

4 个答案:

答案 0 :(得分:2)

Bogatron的评论是正确答案。如果您没有使用输入功能并要求返回标签,则分类器是错误的方法。基于过去的数据对未来建模通常是通过regression完成的。最简单的方法可能是最小二乘法,它允许您选择一个简单的模型(思考曲线拟合),您可以从中选择一个数据点并计算预测值。

答案 1 :(得分:1)

我认为他打算做分类。在分类方面,您通常将现有数据分为两组:测试和培训。您对训练数据进行了所有培训,当您认为完成后,您将使用测试集进行验证。如果集合上的表现非常不同,那么你要么过度训练,要么根本不能将问题归类为此类型。如果您的数据非常少,则可以尝试k-fold策略。

答案 2 :(得分:0)

您要做的事情可能被称为“时间序列预测”,您的输入可以是过去预测的窗口(如果仍在当前窗口位置内,则为过去的数据)。

答案 3 :(得分:0)

您只能根据训练集中的内容,即旧数据或当前数据进行预测。获得准确预测的最佳方法是对新样本进行推广,以确保您不会过度适应模型。如果您认为您的模型没有准确反映您必须预测的最新数据中的内容,那么您可能需要了解其他功能。