python - 如何在多天内处理来自多个来源的多个功能？

我对ML比较陌生，所以我希望这不太基本。

我在一家软件公司工作，正在为用户的健康和保留建模。基本上，每个用户都与我们签订为期12个月的合同。因此，对于每个用户，我们在其与我们一起的12个月内都有一系列活动，在此之后的12个月内，他们续签合同（积极）或从我们的服务中流失（消极）。

我认为我可以构建一个监督分类模型，该模型给出客户健康评分（满分100分），该分数代表用户续签合同的机会百分比。理想情况下，此分数应查看30天的移动用户数据集。这样，我们就可以在合同的早期为用户建立健康评分，而不仅仅是续订时的健康评分。

但是，由于每个用户集本质上都是包含日期和活动的庞大矩阵，因此我陷入了如何组织数据的困境，因此如何思考每个模型是肯定的还是否定的。我应该在python中创建数据帧数组吗？这里的第一步是什么？

请随意说出我是否偏离了路线/吠叫了错误的树，或者这不是寻求一般帮助而不是代码问题的错误论坛。谢谢！