预测问题-使用6个月的数据建立模型并根据1个月的数据进行预测吗?

时间:2018-09-24 21:49:06

标签: python machine-learning logic data-science prediction

我有一个数据集,其中包含六个月内用户的网站使用行为。它包含有关以下数据:

  • 浏览的页面数
  • 与每个用户相关联的唯一Cookie的数量
  • 不同数量的操作系统,使用的浏览器
  • 参观过的城市数量

这里的所有东西都是在六个月的时间内收集的。我已经使用这些数据来训练模型来预测目标变量“ y”。一切都是数字格式。

现在我知道了它的六个月数据,并且该模型基于这六个月的数据,因此我可以使用它来预测接下来六个月的数据,以获得目标变量y。

我的问题是,如果我不是使用模型来预测六个月的时间框架,而是使用模型来预测一个月的时间框架,会给我不正确的结果吗?

我的逻辑告诉我是,例如,我使用了决策树和随机森林之类的树方法,这些算法使阈值产生输出“ 0/1”。现在,如果我们从一个月的角度来看它,或者从六个月的角度来看,我上面提到的变量(例如关联的cookie数量,操作系统,浏览器等)将具有不同的值。例如,与用户相关联的唯一Cookie的数量如果在一个月内看到会减少,而从6个月的角度来看会增加。

但是我对模型是否会在运行每月数据时自动调整这些值感到困惑。请您帮助我了解如果我认为是对还是错。另外,请尽可能提供合理的解释。

谢谢。

1 个答案:

答案 0 :(得分:0)

您的最小测量单位是6个月吗?我希望不会,但是如果是的话,那么我建议您不要尝试预测接下来的1个月。

除了一年内的季节性外,您还需要每天进行体积测量。.我非常担心要根据每月甚至每周的数据来建立任何东西。

在建模技术方面,请坚持使用像kungphu建议的简单回归方法。