我想连接两个框架。也可以这样做。 但是,这样做时,日期格式会自动更改,这是无用的,需要解决。我有一个名为EVENT_DATE的列,其格式为'YYYY-MM-DD'。但是它正在改变。
此处将示例TSV格式的数据加载到数据框
>>>df1 = pd.read_csv('detail_trend_analysis_data.csv',delimiter='|', parse_dates=[0])
>>>df1.head()
EVENT_DATE EVENT_HOUR PRODUCT ... BONUS_VOLUME BONUS_COST RECORD_COUNT
0 2019-11-08 0 1 ... 0.0 220152.426342 287516
1 2019-11-08 0 1 ... 0.0 0.000000 3104
2 2019-11-08 0 1 ... 0.0 226544.777596 254965
3 2019-11-08 0 1 ... 0.0 0.000000 2449
4 2019-11-08 0 1 ... 0.0 0.000000 35085
[5 rows x 18 columns]
做同样的事情
>>>df2 = pd.read_csv('detail_trend_analysis_data.csv',delimiter='|', parse_dates=[0])
更改日期
>>>df2['EVENT_DATE']='2019-11-09'
>>>df2.head()
EVENT_DATE EVENT_HOUR PRODUCT ... BONUS_VOLUME BONUS_COST RECORD_COUNT
0 2019-11-09 0 1 ... 0.0 220152.426342 287516
1 2019-11-09 0 1 ... 0.0 0.000000 3104
2 2019-11-09 0 1 ... 0.0 226544.777596 254965
3 2019-11-09 0 1 ... 0.0 0.000000 2449
4 2019-11-09 0 1 ... 0.0 0.000000 35085
[5 rows x 18 columns]
串联
>>>frames=[df1,df2]
>>>df=pd.concat(frames)
>>>df.head()
EVENT_DATE EVENT_HOUR ... BONUS_COST RECORD_COUNT
0 2019-11-08 00:00:00 0 ... 220152.426342 287516
1 2019-11-08 00:00:00 0 ... 0.000000 3104
2 2019-11-08 00:00:00 0 ... 226544.777596 254965
3 2019-11-08 00:00:00 0 ... 0.000000 2449
4 2019-11-08 00:00:00 0 ... 0.000000 35085
[5 rows x 18 columns]
但是最后,我不想使用“ YYY-MM-DD HH24:MI:SS”。 该如何解决?
答案 0 :(得分:0)
如果在两个数据帧上都设置df ['EVENT_DATE] = df ['EVENT_DATE']。dt.date,该怎么办?