我有像这样的1000行的数据集
Date, Cost, Quantity(in ton), Source, Unloading Station
01/10/2015, 7, 5.416, XYZ, ABC
我想在日期的基础上拆分数据。对于例如到2016年12月20日为训练数据,之后是测试数据。
我该怎么分裂?有可能吗?
答案 0 :(得分:4)
假设您的数据集是pandas数据框,并且Date
列属于datetime
dtype:
split_date = pd.datetime(2016,12,20)
df_training = df.loc[df['Date'] <= split_date]
df_test = df.loc[df['Date'] > split_date]
答案 1 :(得分:0)
如果您的日期为标准python日期时间格式,即'2016-06-23 23:00:00',您可以使用下面的代码
split_date ='2016-06-23 23:00:00'
train_data = train_data.loc[train_data['Date'] <= split_date]
validation_data = train_data.loc[train_data['Date'] > split_date]