我想将timedelta的数据帧转换为小时。我可以针对一个系列(数据框的一列)执行此操作,但我想找到一种将其应用于所有列的方法。
for loop
可以工作,但是有更快或更Python的方式来做到这一点吗?
import pandas as pd
import datetime
import numpy as np
df = pd.DataFrame({'a': pd.to_timedelta(['0 days 00:00:08','0 days 05:05:00', '0 days 01:01:57']),
'b' : pd.to_timedelta(['0 days 00:44:00','0 days 00:15:00','0 days 01:02:00']),
'c': pd.to_timedelta(['0 days 00:34:33','0 days 04:04:00','0 days 01:31:58'])})
df
a b c
0 00:00:08 00:44:00 00:34:33
1 05:05:00 00:15:00 04:04:00
2 01:01:57 01:02:00 01:31:58
for c in df.columns:
df[c] = (df[c]/np.timedelta64(1,'h')).astype(float)
df
a b c
0 0.002222 0.733333 0.575833
1 5.083333 0.250000 4.066667
2 1.032500 1.033333 1.532778
我尝试使用lambda,但是出现了一些问题:
df = df.apply(lambda x: x/np.timedeltat(1, 'h')).astype(float)
返回错误:
AttributeError: ("'module' object has no attribute 'timedelta'", u'occurred at index a')
答案 0 :(得分:2)
使用np.timedelta64
处理所有转换为2d numpy数组的列:
df = pd.DataFrame(df.values / np.timedelta64(1, 'h'), columns=df.columns, index=df.index)
print (df)
a b c
0 0.002222 0.733333 0.575833
1 5.083333 0.250000 4.066667
2 1.032500 1.033333 1.532778
如果要使用apply
:
df = df.apply(lambda x: x/np.timedelta64(1, 'h'))
print (df)
a b c
0 0.002222 0.733333 0.575833
1 5.083333 0.250000 4.066667
2 1.032500 1.033333 1.532778
df = df.apply(lambda x: x.dt.total_seconds() / 3600)
print (df)
a b c
0 0.002222 0.733333 0.575833
1 5.083333 0.250000 4.066667
2 1.032500 1.033333 1.532778