预测时如何考虑特征?

时间:2019-09-02 13:29:03

标签: data-science data-science-experience

我必须根据员工过去基于区域,插槽的数据来预测他们的未来使用率。

我想在预测中包括以下两个区域和槽位。任何建议如何进行。

数据看起来像

dt          zone    slot       utilization
--          ----    -----      -----------
2019-06-23  236    1        87.018695

2019-07-07  218    3        37.497308

2019-07-08  218    2        49.132561

python是我们在这里使用的编程语言。

1 个答案:

答案 0 :(得分:0)

也许您可以提供更多详细信息?您是说要通过使用 zone slot 功能预测利用率参数。然后您继续说 zone 和' hour '?什么是“ <小时>小时”?

要回答您的问题,这种类型的问题可以看作是回归问题,因为您要估算数值“ 利用率”。您使用什么语言?对于Python,scikit library具有一些易于实现的回归模型。

此外,如果您认为说明性特征 zone slot categorical特征,则可能需要对它们进行虚拟编码。