用于预测在线学生成绩的时间序列模型?

时间:2019-09-05 19:56:21

标签: python pandas scikit-learn time-series forecasting

我有一个数据集,其中包含在线学生的日常活动(花费的时间,观看的视频等)。基于这些数据,我想预测每个学生是否会通过。到现在为止,我一直将其视为分类问题,每周训练一个模型,其中包含到目前为止的学生活动及其最终结果。

此模型运行良好,但是随着时间的推移它会忽略行为。我有兴趣进行某种时间序列分析,其中模型考虑了每个学生随时间推移的所有数据点,以便做出最终预测。

我一直在寻找的时间序列模型旨在预测未来时间步长的特定指标(需求,收入等)。就我而言,我对汇总的时间步长度量标准不感兴趣,而对个人的最终结果更感兴趣。

换句话说,我的问题更多是分类或回归问题,但我希望能够随着时间的推移利用每个学生的使用模式。有没有办法将两者结合起来?基本上建立一个更好的分类器,该分类器可以随着时间的推移了解模式。

2 个答案:

答案 0 :(得分:0)

查看fbprophet模块。这样可以将时间序列分为趋势,季节性和噪声等成分。该模块最初是为网络流量开发的。

您可以通过构造其他变量以多种方式将其合并到回归模型中,例如:

  • 学期开始到学期末的趋势比率
  • 每周季节性模式的强度
  • 白噪声序列的方差。

更不用说这些构造变量在您的模型中将很重要,但这是我会尝试的事情类型。您可以完全不用任何复杂的时间序列模型来构造其中一些变量,例如,可以在excel中计算在课程开始时与课程结束时所花费的观看时间之比。

答案 1 :(得分:0)

从广义上讲,您有两个选择:

  1. 为您的功能创建时间分段聚合,以帮助其捕获时间依赖性。您还可以使用tsfresh之类的东西从时间序列中自动生成特征。

  2. 使用多元时间序列模型。您可以尝试RNN或VAR(例如here