如何实现自定义pandas.Grouper
类?
换句话说-pandas.Grouper
的子类应该实现哪些方法/接口,以便可以作为DataFrame.groupby
的自变量运行?
作为一个简短的玩具示例:编写一个分组器类,该类将基于某些特定字符串列的前5个符号对数据帧进行分组。确实,使用现有方法很容易做到这一点:
df.groupby(df[column].str[:5])
但是我要寻找的是实现一些NameGrouper
类,以便通过以下方式完成操作:
df.groupby(NameGrouper(column))
p.s。 因此,关于使用标准熊猫功能的答案来针对特定需求(例如Pandas: Custom group-by function,Pandas customized group aggregation,Pandas groupby custom groups)进行分组匹配的问题很多。但是我对默认熊猫功能的扩展感兴趣。