我正在尝试应用机器学习方法来预测/分析用户的行为。我拥有的数据具有以下格式:
我是机器学习的新手,所以我试图了解我在做什么有意义。现在在活动列中,我有两种可能分别表示为0或1。在时间列中,我以循环方式将时间映射到范围(0-24)。现在,用户在某个时间(onehot编码)执行一项活动。如果我将活动列用作机器学习中的目标列,并尝试预测用户是否会在某个时间执行一项或多项活动,那么这有意义吗?
我要预测活动的原因是,如果我的模型为我提供了一些有关活动预测的结果,并且用户实时地做了其他事情(上个星期左右他没有做过),我想将其视为偏离正常行为的行为。
我在做对还是错?任何建议将不胜感激。谢谢。
答案 0 :(得分:0)
我认为您的想法是正确的,但是机器学习模型并非始终都是100%准确的。这就是为什么为模型定义“准确性”的原因。
如果您想创建高性能的预测模型,请选择深度学习模型,因为随着训练数据集规模的增加,其性能会随着时间的推移而提高。
答案 1 :(得分:0)
我认为这是分类问题的好用例。由于您的数据集中只有很少的列(特征),因此我想从简单的Boosted Decision Tree分类算法开始。
答案 2 :(得分:0)
您的想法是正确的,这基本上是欺诈检测AI在某些情况下的工作方式,一种选择是使用decision tree model,这可能有助于动态扩展。
我当时在从事同一项目,但方向不同,请看一下它可能会有所帮助:) https://github.com/dmi3coder/behaiv-java。