我正在为游戏制作玩家流失预测模型。我有数轮的时间序列为60天。在我将时间序列提供给分类算法之前,我需要对时间序列进行标准化。
我正在考虑通过将x转换为x / Max(x)来使用min-max归一化。 60天时间序列中的最大值(x)不一定能够捕捉到玩家通常每天玩多少次的高峰。
但是,将x变换为(x-mean(x))/ std(x)的z标准化将不起作用,因为我需要保留没有游戏的日期信息为零。执行z规范化将0映射到不同的值,这使得它们无法比较。
是否存在规范化方案,该方案不需要关于时间序列的最大值的信息,并且可以将0仍然映射到0?
答案 0 :(得分:0)
您可以通过将数组中的每个值除以数组中值的总和(标准化因子“sum to unity”)将值转换为概率。即将x转换为x./sum(x) 这会将0值映射为0,并且不需要有关最大值的信息。