在Pandas中汇总数据时,我可以返回“ count”,“ sum”,“ mean”等字符串来汇总数据。有没有我可以使用的功能代替可以提供相同行为的字符串?例如,如果我尝试使用pd.Series.Count
而不是count,则运行时会受到很大的影响。
import pandas as pd
import numpy as np
n = 10000000
df_nan = pd.DataFrame({"a": np.random.randint(0, 100, n*2),
"b": np.linspace(0, 100, n).tolist() + [None]*n})
%timeit df_nan.groupby("a").agg({"b": pd.Series.count})
1.63 s ± 28 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit df_nan.groupby("a").agg({"b": "count"})
479 ms ± 18.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
您知道我可以返回什么功能吗?