我有一个自行车出租数据集。在此数据集中,我们的目标变量是计数,即自行车出租总数,这是我们数据集中两个变量的总和,即临时用户计数变量和注册用户计数变量。 所以我的问题是我应该如何对该数据集进行建模? 请提出一个建议,因为我正在考虑删除临时用户和注册用户变量,并仅将count变量与其他预测变量一起作为我们的tagert变量
答案 0 :(得分:0)
这个问题很模糊,但是我会尽力回答。
我不太确定您要预测什么。假设将来有一段时间会出租自行车的数量。
如果休闲和已注册之间的区别很重要,并且对项目目的具有重要意义,那么您应该将它们视为独立的功能,而不要将其组合变成一个。
相反,如果区别并不重要,而您只关心自行车的数量,则可以将它们结合起来并使用总和。
我认为您应该尝试了解您要完成的工作以及您希望在分析中回答的问题。
答案 1 :(得分:0)
将我的两个目标变量求和转换为一个,然后创建一个只有一个目标变量的新模型。