我已经编写了一个测试脚本来了解pandas.DataFrame().groupby().apply()
。
df=pd.DataFrame([("a",1),("b",2),("b",1)], columns=["idx", "col1"])
def my_apply(group):
print(group)
return group
df.groupby("idx").apply(my_apply)
因此,组"a"
的数据框打印两次。似乎总是第一个被调用两次,但第一次调用的结果被抛弃了。
为什么my_apply
似乎被第一组调用两次?