如何提高占用率预测的准确性?

时间:2019-09-25 18:09:28

标签: python pandas random-forest data-analysis prediction

我有一个旨在根据给定的日期和天气来预测我当地体育馆的人数的项目。

Here's my Kaggle kernel

我有两个数据集,给定时间的乘员和给定时间的天气。 我的过程是结合这两个数据集,并以“占领者”作为目标。 但是,当我实施回归算法时,我只能达到57%的预测分数。

我希望获得有关如何修改解决方案以获得更好的预测的任何建议?

谢谢。

1 个答案:

答案 0 :(得分:0)

要提高准确性:

  • 进行更多的功能工程。
  • 您可以将分类变量转换为一个热编码值。
  • 您还可以添加一个功能,使用时间戳记中的小时来表示早晨,下午,晚上和晚上,还可以添加“工作日/周末”列。
  • 您没有做太多EDA。检查异常值并将其删除。