为什么这三种方法在pandas中从32m行数据帧中获取组的性能存在差异。
df = df.groupby(["a", "b", "c"]).groups
df = df.groupby(["a", "b", "c"]).count()
df = df.index
df = df.groupby(["a", "b", "c"]).count()
df = df.drop(df.columns, axis=1).reset_index()
最后一种方法需要< 10秒我放弃了等待另外两个。
编辑:添加了错过的方括号。
答案 0 :(得分:0)