是否将函数应用于pandas数据框的每一列而没有for循环?

时间:2018-07-03 10:05:41

标签: python pandas lambda

我想将timedelta的数据帧转换为小时。我可以针对一个系列(数据框的一列)执行此操作,但我想找到一种将其应用于所有列的方法。

for loop可以工作,但是有更快或更Python的方式来做到这一点吗?

import pandas as pd 
import datetime 
import numpy as np


    df = pd.DataFrame({'a': pd.to_timedelta(['0 days 00:00:08','0 days 05:05:00', '0 days 01:01:57']), 
'b' : pd.to_timedelta(['0 days 00:44:00','0 days 00:15:00','0 days 01:02:00']), 
'c': pd.to_timedelta(['0 days 00:34:33','0 days 04:04:00','0 days 01:31:58'])})

df

    a           b           c
0   00:00:08    00:44:00    00:34:33
1   05:05:00    00:15:00    04:04:00
2   01:01:57    01:02:00    01:31:58

for c in df.columns:
    df[c] = (df[c]/np.timedelta64(1,'h')).astype(float)

df

    a           b           c
0   0.002222    0.733333    0.575833
1   5.083333    0.250000    4.066667
2   1.032500    1.033333    1.532778

我尝试使用lambda,但是出现了一些问题:

df = df.apply(lambda x: x/np.timedeltat(1, 'h')).astype(float)

返回错误:

AttributeError: ("'module' object has no attribute 'timedelta'", u'occurred at index a')

1 个答案:

答案 0 :(得分:2)

使用np.timedelta64处理所有转换为2d numpy数组的列:

df = pd.DataFrame(df.values / np.timedelta64(1, 'h'), columns=df.columns, index=df.index)
print (df)
          a         b         c
0  0.002222  0.733333  0.575833
1  5.083333  0.250000  4.066667
2  1.032500  1.033333  1.532778

如果要使用apply

df = df.apply(lambda x: x/np.timedelta64(1, 'h'))
print (df)
          a         b         c
0  0.002222  0.733333  0.575833
1  5.083333  0.250000  4.066667
2  1.032500  1.033333  1.532778

total_seconds

df = df.apply(lambda x: x.dt.total_seconds() / 3600)
print (df)
          a         b         c
0  0.002222  0.733333  0.575833
1  5.083333  0.250000  4.066667
2  1.032500  1.033333  1.532778