我有一个数据框,其中两列的时间不同,且字符串格式不同,我想查找两列之间的差异,因此我使用以下代码
operational_data_clean['Pick/pack start-time'] = pd.to_datetime(operational_data_clean['Pick/pack start-time'])
operational_data_clean['Flight launched-time'] = pd.to_datetime(operational_data_clean['Flight launched-time'])
operational_data_clean['time_to_launch'] = 0
operational_data_clean['time_to_launch'] = operational_data_clean['Flight launched-time'] - operational_data_clean['Pick/pack start-time']
但是,当我第一次运行此代码时,我得到了很好的结果,但是当我第二次运行时,它会将今天的日期添加到“选择/打包开始时间”和“飞行启动时间”值上。
如何在不弄乱数据的日期的情况下将这段时间仅转换为几个小时。
答案 0 :(得分:0)
我假设您正在使用jupyter notebook运行代码。
执行代码时,变量operational_data_clean['Pick/pack start-time']
变为pd.to_datetime(operational_data_clean['Pick/pack start-time'])
。
因此,当您再次执行该块时,jupyter会记住您的变量,因此将再次执行相同的功能,基本上就是这样:
pd.to_datetime(pd.to_datetime(operational_data_clean['Pick/pack start-time']))
。
对于pd.to_datetime()
本身,我建议您仔细浏览一下熊猫docs。