按月将数据集分为训练和测试

时间:2019-08-02 19:40:13

标签: python neural-network training-data test-data

我在任何地方都找不到答案。我有三个月的数据,我想将其分为训练集的前两个月(“ Jan-19”,“ Feb-19”)和测试的最后一个月(“ Mar-19”)。

以前,我已经使用以下简单代码进行了随机采样:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30,random_state=109)

,在此之前,将y用作标签,将x用作预测列。我不确定如何将测试和培训分配给我想要的月份。

谢谢

2 个答案:

答案 0 :(得分:0)

如果您的数据在熊猫数据框中,则可以使用如下子设置:

X_train = X[X['month'] != 'Mar-19']
y_train = y[X['month'] != 'Mar-19']

X_test = X[X['month'] == 'Mar-19']
y_test = y[X['month'] == 'Mar-19']

答案 1 :(得分:0)

您尝试此选项,看看是否有帮助。

dataset_train = df['2004-02-12 11:02:39':'2004-02-13 23:52:39']
dataset_test = df['2004-02-13 23:52:39':]