这是一个简单的DataFrame:
import numpy as np
dd=pd.DataFrame(np.arange(35).reshape(7,5), columns=list('xyzwv'))
dd['w']=list('AABBBCC')
,即:
现在我尝试以下代码
def func(x):
print(x)
return x
dd.groupby('w').apply(func)
然后打印出来:
看起来func()被调用了两次同一组。 我做错了什么?
答案 0 :(得分:2)
apply
两次调用第一组来确定它是否可以进行一些优化,请参阅
http://pandas.pydata.org/pandas-docs/stable/groupby.html#flexible-apply