预测一个表,其中许多行中存在目标变量的相同值,并且所有行具有不同的信息(主键除外)。如何使用多行中的所有信息仅预测一个结果。
如您所见,所有3行都具有相同的AccountNumber,因此具有相同的增长率。我不知道如何一起使用3行来预测5%。但是,由于销售增长率(目标变量)与salesAmount相关,所以我仅凭预测salesAmount会更好吗?但是,如果我那样做,将会丢失增长超时的信息。使用其他一些列(例如日期)来计算增长,在此示例中我未包括在内。
The data looks like this, where Growth is target variable.
#accountNum sales Product Growth(%)
#1 100 B 5%
#1 200 A 5%
#1 300 C 5%
我希望看到任何可以仅使用表中所有信息并预测增长的预测模型。