考虑这种情况:
Python pandas equvilant to R groupby mutate
在dplyr
:
df = df%>% group_by(a,b) %>%
首先表示数据框按列a
分组,然后按b
分组。
在我的情况下,我尝试先按group_name
列,然后按user_name
,然后按type_of_work
对数据进行分组。有三列以上(这就是为什么我感到困惑)但我需要按照相同顺序按照这三个标题分组的数据。在此阶段之后,我已经有了一个算法来处理列。我只需要一个算法来创建根据这三列分组的数据帧。
在我的情况下,重要的是像dplyr
函数一样保留序列。
我们在pandas
数据框架中有类似内容吗?
答案 0 :(得分:0)
Grouped = df.groupby(['a','b'])
阅读更多关于pandas文档中“split-apply-combine”策略的信息,了解pandas如何处理这些问题与R相比。
从您的评论中,您似乎想要分配分组的帧。您可以通过API使用groupbyobject,例如grouped.mean(),也可以遍历groupby对象。您将在每个循环中获得名称和组。