讨论每月续订的客户流失预测逻辑

时间:2019-02-06 21:48:33

标签: python machine-learning logic data-science data-modeling

我有一个基于订阅的业务数据集,如下所示:

Company    RenewalMonth    Year   Month  Metrics
 ABC          10           2018    1     ...
 DEF           1           2018    1     ...
 GHI           7           2018    1     ...
 ABC          10           2018    2     ...
 DEF           1           2018    2     ...
 GHI           7           2018    2     ...
 ABC          10           2018    3     ...
 DEF           1           2018    3     ...
 GHI           7           2018    3     ...
 ABC          10           2018    4     ...
 DEF           1           2018    4     ...
 GHI           7           2018    4     ...
 ABC          10           2018    5     ...
 DEF           1           2018    5     ...
 GHI           7           2018    5     ...

依此类推,大约有1万个帐户,过去5年中我每个月都有其数据使用情况。

此处 RenewalMonth 代表该帐户每年进行更新的月份。 年份和月份表示该年和月份的汇总使用参数,使用指标由会话,内容,区域,产品等参数组成。

我正在构建“客户流失”模型,但是由于每个帐户的续订月份都不相同,因此这会带来一个独特的问题。如果我汇总2017年的衡量指标,并将其用作预测2018年的数据,则假设我考虑了最近12个月的数据,因此假设每个账户的续订发生在2018年1月1日

但是,由于续签是在不同月份进行的,因此另一种方法是找到每个帐户12个月的滚动使用情况,然后将其映射以进行预测。 例如,有一个帐户“ xyz”的续订时间为11月,我将映射其最近12个月使用情况的数据,将其用作测试数据,而我的火车数据将包含所有这些数据的12个月的滚动数据已续约的帐户,即续约在11月之前的任何帐户。 但这是一项非常艰巨的任务,因为大约有10000个帐户,并且很难找到这些帐户的单独滚动方式。

有人可以帮我映射此逻辑,以创建一个连续12个月的客户流失预测模型吗?

0 个答案:

没有答案