我有一个数据集,其中包含在线学生的日常活动(花费的时间,观看的视频等)。基于这些数据,我想预测每个学生是否会通过。到现在为止,我一直将其视为分类问题,每周训练一个模型,其中包含到目前为止的学生活动及其最终结果。
此模型运行良好,但是随着时间的推移它会忽略行为。我有兴趣进行某种时间序列分析,其中模型考虑了每个学生随时间推移的所有数据点,以便做出最终预测。
我一直在寻找的时间序列模型旨在预测未来时间步长的特定指标(需求,收入等)。就我而言,我对汇总的时间步长度量标准不感兴趣,而对个人的最终结果更感兴趣。
换句话说,我的问题更多是分类或回归问题,但我希望能够随着时间的推移利用每个学生的使用模式。有没有办法将两者结合起来?基本上建立一个更好的分类器,该分类器可以随着时间的推移了解模式。
答案 0 :(得分:0)
查看fbprophet
模块。这样可以将时间序列分为趋势,季节性和噪声等成分。该模块最初是为网络流量开发的。
您可以通过构造其他变量以多种方式将其合并到回归模型中,例如:
更不用说这些构造变量在您的模型中将很重要,但这是我会尝试的事情类型。您可以完全不用任何复杂的时间序列模型来构造其中一些变量,例如,可以在excel中计算在课程开始时与课程结束时所花费的观看时间之比。
答案 1 :(得分:0)
从广义上讲,您有两个选择:
为您的功能创建时间分段聚合,以帮助其捕获时间依赖性。您还可以使用tsfresh之类的东西从时间序列中自动生成特征。
使用多元时间序列模型。您可以尝试RNN或VAR(例如here)