我在任何地方都找不到答案。我有三个月的数据,我想将其分为训练集的前两个月(“ Jan-19”,“ Feb-19”)和测试的最后一个月(“ Mar-19”)。
以前,我已经使用以下简单代码进行了随机采样:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30,random_state=109)
,在此之前,将y用作标签,将x用作预测列。我不确定如何将测试和培训分配给我想要的月份。
谢谢
答案 0 :(得分:0)
如果您的数据在熊猫数据框中,则可以使用如下子设置:
X_train = X[X['month'] != 'Mar-19']
y_train = y[X['month'] != 'Mar-19']
X_test = X[X['month'] == 'Mar-19']
y_test = y[X['month'] == 'Mar-19']
答案 1 :(得分:0)
您尝试此选项,看看是否有帮助。
dataset_train = df['2004-02-12 11:02:39':'2004-02-13 23:52:39']
dataset_test = df['2004-02-13 23:52:39':]