应用错误收集

用户行为预测/分析

时间：2018-08-11 18:24:02

标签： machine-learning data-science

我正在尝试应用机器学习方法来预测/分析用户的行为。我拥有的数据具有以下格式：

我是机器学习的新手，所以我试图了解我在做什么有意义。现在在活动列中，我有两种可能分别表示为0或1。在时间列中，我以循环方式将时间映射到范围（0-24）。现在，用户在某个时间（onehot编码）执行一项活动。如果我将活动列用作机器学习中的目标列，并尝试预测用户是否会在某个时间执行一项或多项活动，那么这有意义吗？

我要预测活动的原因是，如果我的模型为我提供了一些有关活动预测的结果，并且用户实时地做了其他事情（上个星期左右他没有做过），我想将其视为偏离正常行为的行为。

我在做对还是错？任何建议将不胜感激。谢谢。

3 个答案:

答案 0 :(得分：0)

我认为您的想法是正确的，但是机器学习模型并非始终都是100％准确的。这就是为什么为模型定义“准确性”的原因。

如果您想创建高性能的预测模型，请选择深度学习模型，因为随着训练数据集规模的增加，其性能会随着时间的推移而提高。

答案 1 :(得分：0)

我认为这是分类问题的好用例。由于您的数据集中只有很少的列（特征），因此我想从简单的Boosted Decision Tree分类算法开始。

答案 2 :(得分：0)

您的想法是正确的，这基本上是欺诈检测AI在某些情况下的工作方式，一种选择是使用decision tree model，这可能有助于动态扩展。

我当时在从事同一项目，但方向不同，请看一下它可能会有所帮助:) https://github.com/dmi3coder/behaiv-java。