基于序列数据的流失率预测

时间:2019-12-26 19:44:12

标签: machine-learning deep-learning time-series pytorch

我正在尝试建立一个机器学习模型,该模型可以根据某位用户的历史静态和动态数据预测其是否会流失。数据如下所示:

myForm.get('testimonials').controls

数据集中有许多testimonialsForm.controls ,每个1) timestamp, user1, user info (static), event info(dynamic), 0 2) timestamp, user1, user info (static), event info(dynamic), 0 3) timestamp, user1, user info (static), event info(dynamic), 1 4) timestamp, user2, user info (static), event info(dynamic), 0 5) timestamp, user2, user info (static), event info(dynamic), 0 6) timestamp, user2, user info (static), event info(dynamic), 0 7) timestamp, user2, user info (static), event info(dynamic), 0 8) timestamp, user2, user info (static), event info(dynamic), 0 可以是长度可变的序列。每个用户的功能分为两个部分。一个是user_id,可以将其视为每个用户的常数。另一部分是user info,其中包括随时间变化的功能。

请让我知道在机器学习/深度学习中应该如何处理该问题,最好在event info中提供详细的分步教程。

1 个答案:

答案 0 :(得分:0)

“ user_id”分为“ user_info”和“ event_info”两部分,其中“ user_info”是常量部分,因此我们不必担心,“ event_info”本质上是动态的,其中包括有时包含null / NA的功能值和其他时间具有合法值。

由于我们不了解功能的性质,因此我们将案例分为连续案例和分类案例。

情况:

  • 如果动态要素是连续值-

    • 每当在要素中找到null / NA值时,您都可以选择零,-1或任何其他整数(取决于要素的当前值)-通过这种方式,您的模型(ML或DL)将能够借助动态功能有效地工作。
  • 第二种情况,其类别值-

    • 为此,在每个要素中仅包括一个类别,它可能表示Null / NA值。

这就是我如何处理这种情况,并且效果很好。为此,您不需要任何pytorch教程,python即可完成工作。