我的工作中确实有一些麻烦。我试图在周末解决以下问题,但没有成功。
好的,我们运行一个学校教育平台,我们希望实现以下目标。我们有一个模型来识别学生失去兴趣的可能性(损失率)。
现在,如果在某个时间点(t)的丢失率与之前的时间点(t-6)相比增加到某个阈值以上,我们希望向学生提供折扣优惠,甚至提供免费课程。问题是如何正确设置阈值?我的意思是使用关于学生在t + 12时点离开我们平台的事实数据来最大程度地减少假阳性和假阴性。
我们当前的方法和数据如下所示。根据历史数据,我们进行以下设置: [学生ID],[LifteTimeValue],[Lossrate_now(t)],[Lossrate_then(t-6)],[绝对差([t1]-[t-6])],[相对差(([t1]- [t-6])/ [t-6])],[可观察到的损失(t + 12)]
我想做的是有一些LTV存储桶和阈值。根据阈值,我们可以邮寄/不邮寄客户,LTV存储桶可以帮助我们提供报价。
所需的行动规则集如下所示(实用):
*注意:在LTV组中拆分可能不相关,这意味着它对优化没有帮助。
我们希望具有成本效益,因此我们可以在付费/免费服务之间保持平衡。 首选解决方案是在Python中,但R也是一个选择。并且一些可视化有助于将结果解释给其他人!
感谢您抽出宝贵的时间阅读本文。 恒钟