大熊猫中的自定义石斑鱼对象

时间:2020-08-24 07:44:33

标签: python pandas pandas-groupby

如何实现自定义pandas.Grouper类?

换句话说-pandas.Grouper的子类应该实现哪些方法/接口,以便可以作为DataFrame.groupby的自变量运行?

作为一个简短的玩具示例:编写一个分组器类,该类将基于某些特定字符串列的前5个符号对数据帧进行分组。确实,使用现有方法很容易做到这一点:

df.groupby(df[column].str[:5])

但是我要寻找的是实现一些NameGrouper类,以便通过以下方式完成操作:

df.groupby(NameGrouper(column))

p.s。 因此,关于使用标准熊猫功能的答案来针对特定需求(例如Pandas: Custom group-by functionPandas customized group aggregationPandas groupby custom groups)进行分组匹配的问题很多。但是我对默认熊猫功能的扩展感兴趣。

0 个答案:

没有答案