我的熊猫大熊猫数据框不平衡。
我想将此数据分为训练集和测试集。 Python的train_test_split方法由于会进行随机拆分而无法工作,因此,很可能会将来自t +1的观测值放入训练集中,并将来自t的观测值放入测试集中。
当然,这毫无意义,因为未来无法预测过去。
TimeSeriesSplit也将不起作用,因为此函数未考虑我的数据集的面板尺寸。
是否有一种简单的方法可以对不平衡的面板数据集进行火车测试拆分?这种划分应(1)考虑数据集的面板维度,并且(2)将较早的观察结果放入训练集中,将较晚的观察结果放入测试集中。