在Pandas Groupby Agg中使用函数代替字符串

时间:2019-04-17 15:27:17

标签: python pandas numpy

在Pandas中汇总数据时,我可以返回“ count”,“ sum”,“ mean”等字符串来汇总数据。有没有我可以使用的功能代替可以提供相同行为的字符串?例如,如果我尝试使用pd.Series.Count而不是count,则运行时会受到很大的影响。

import pandas as pd
import numpy as np

n = 10000000
df_nan = pd.DataFrame({"a": np.random.randint(0, 100, n*2),
                       "b": np.linspace(0, 100, n).tolist() + [None]*n})



%timeit df_nan.groupby("a").agg({"b": pd.Series.count})
1.63 s ± 28 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit df_nan.groupby("a").agg({"b": "count"})
479 ms ± 18.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

您知道我可以返回什么功能吗?

0 个答案:

没有答案