如何在多天内处理来自多个来源的多个功能?

时间:2019-04-01 08:23:51

标签: python machine-learning

我对ML比较陌生,所以我希望这不太基本。

我在一家软件公司工作,正在为用户的健康和保留建模。基本上,每个用户都与我们签订为期12个月的合同。因此,对于每个用户,我们在其与我们一起的12个月内都有一系列活动,在此之后的12个月内,他们续签合同(积极)或从我们的服务中流失(消极)。

我认为我可以构建一个监督分类模型,该模型给出客户健康评分(满分100分),该分数代表用户续签合同的机会百分比。理想情况下,此分数应查看30天的移动用户数据集。这样,我们就可以在合同的早期为用户建立健康评分,而不仅仅是续订时的健康评分。

但是,由于每个用户集本质上都是包含日期和活动的庞大矩阵,因此我陷入了如何组织数据的困境,因此如何思考每个模型是肯定的还是否定的。我应该在python中创建数据帧数组吗?这里的第一步是什么?

请随意说出我是否偏离了路线/吠叫了错误的树,或者这不是寻求一般帮助而不是代码问题的错误论坛。谢谢!

0 个答案:

没有答案