我正在研究学区支出与该学区内城市/城镇犯罪率的关系,特别是从2000年到2017年。大约有14,000个学区。犯罪数据是DVD;有很多协变量:人均收入,人口密度,人口流行等。总计我有90,000个观察值(我受到向FBI报告犯罪的城市/城镇的限制)
我有一个多层次的混合效应模型,正在尝试与训练/测试数据集进行交叉验证。
我已经在线搜索了。尝试使用插入符号和其他方法。没有骰子。我发现一个适合时间序列的软件包,不适用于混合效应模型(请仔细阅读Rob Hyndman的帖子和预测,确实如此:可以处理时间序列,但不能处理混合效应)
我可以编写代码进行常规的交叉验证/ k折,但是我确实达到了这里的极限。