假设我有一个大型数据框,并且我想对列中的每个元素应用一个操作。
是否有更快的方式来执行此操作:
get_weekday = lambda x: time.strptime(str(x), '%d%m%Y').tm_wday
df['date'] = df['date'].apply(get_weekday)
答案 0 :(得分:5)
在当前主/ 0.15.0
中df['date'].dt.weekday
在以前的版本中
pd.DatetimeIndex(df['date']).weekday
这是一个时间示例
In [16]: s = Series(date_range('20130101',freq='s',periods=100000))
In [17]: %timeit s.dt.weekday
10 loops, best of 3: 50.8 ms per loop
In [18]: s2 = s.apply(str)
In [19]: %timeit s.apply(lambda x: time.strptime(str(x), "%Y-%m-%d %H:%M:%S").tm_wday)
1 loops, best of 3: 2.65 s per loop