根据日期将数据框拆分为两个

时间:2016-05-30 18:53:20

标签: python dataset

我有像这样的1000行的数据集

 Date,      Cost,         Quantity(in ton),    Source,          Unloading Station
    01/10/2015, 7,            5.416,               XYZ,           ABC

我想在日期的基础上拆分数据。对于例如到2016年12月20日为训练数据,之后是测试数据。

我该怎么分裂?有可能吗?

2 个答案:

答案 0 :(得分:4)

假设您的数据集是pandas数据框,并且Date列属于datetime dtype:

split_date = pd.datetime(2016,12,20)

df_training = df.loc[df['Date'] <= split_date]
df_test = df.loc[df['Date'] > split_date]

答案 1 :(得分:0)

如果您的日期为标准python日期时间格式,即'2016-06-23 23:00:00',您可以使用下面的代码

split_date ='2016-06-23 23:00:00' train_data = train_data.loc[train_data['Date'] <= split_date] validation_data = train_data.loc[train_data['Date'] > split_date]