如何在pandas数据帧中组合datetime.date和datetime.time列?

时间:2017-08-14 19:39:40

标签: python python-3.x pandas datetime dataframe

给定df

          Date      Time    Data     
3   2017-08-10  15:15:00    a    
0   2017-08-11  15:15:00    b    
1   2017-08-12  15:15:00    c    
2   2017-08-13  15:15:00    d    
1   2017-08-14  15:15:00    e    

print (type(df['Date'].iat[0]))
<class 'datetime.date'>

print (type(df['Time'].iat[0]))
<class 'datetime.time'>

如何将df.Date和df.Time组合成Datetime对象的DateTime列?:

        Date        Time    Data  DateTime   
3   2017-08-10  15:15:00    a     2017-08-10 15:15:00
0   2017-08-11  15:15:00    b     2017-08-11 15:15:00
1   2017-08-12  15:15:00    c     2017-08-12 15:15:00
2   2017-08-13  15:15:00    d     2017-08-13 15:15:00
1   2017-08-14  15:15:00    e     2017-08-14 15:15:00

我尝试了什么:

df['DateTime'] = df.apply(lambda r : pd.datetime.combine(r['Date'],r['Time']),1)

这样可以正常运行,但是,我更喜欢矢量化操作,我得到以下信息:

C:\Users\User\Anaconda3\lib\site-packages\ipykernel\__main__.py:1: 
SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-
docs/stable/indexing.html#indexing-view-versus-copy
if __name__ == '__main__':

2 个答案:

答案 0 :(得分:2)

这里的问题是日期和时间都是日期时间格式。试试

df['datetime'] = pd.to_datetime(df['Date'].dt.strftime('%Y-%m-%d') + df['Time'].astype(str), format = '%Y-%m-%d%H:%M:%S')

虽然我不知道它是否比使用datetime.combine更有效

答案 1 :(得分:0)

我迟到了……如果“日期”是一个类似日期时间的对象,那么 Vaishali 的回答有效。

str(date) 会给 yyyy-mm-dd 输出 according to docs,所以你可以这样做:

pd.to_datetime(df['Date'].astype(str) + df['Time'].astype(str), format = '%Y-%m-%d%H:%M:%S')

但是,我没有测试过它的速度。