当解释变量的大小在长度/大小上不同时的回归

时间:2016-01-12 17:52:37

标签: machine-learning time-series regression modeling feature-extraction

当您执行回归时,通常认为正确的方法是什么,并且您的训练数据包含某种类型的“事件”,但每条训练线可能会有不同数量的这些项目?

举个例子 - 假设我想预测在许多不同道路上发生事故的可能性。对于每条道路,我可能有多次事故的历史,每次事故都有自己不同的属性(日期(最近),伤亡人数等)。如何在一条线上封装所有这些信息?

例如,您可以假设最多(比如说)十,并将每个的详细信息包含为单独的输入(date1,NoC1,date2,NoC2等等),但问题是我们希望每个项目都是处理方式类似,模型将第4栏中的项目与上面第2栏中的项目基本分开,但不应该这样。

或者我们可以为每个事件包含一行,但是每行中与这些“事件”无关的任何其他列(例如道路年龄,宽度等)将被多次包含在内,从而产生偏差在结果中。

用于实现此目的的标准方法是什么?

非常感谢

0 个答案:

没有答案