在pandas数据帧中的函数,它复制R中的dplyr group_by(多个变量)函数

时间:2017-06-19 09:30:26

标签: python r pandas dataframe

考虑这种情况:

Python pandas equvilant to R groupby mutate

dplyr

df = df%>% group_by(a,b) %>%  

首先表示数据框按列a分组,然后按b分组。

在我的情况下,我尝试先按group_name列,然后按user_name,然后按type_of_work对数据进行分组。有三列以上(这就是为什么我感到困惑)但我需要按照相同顺序按照这三个标题分组的数据。在此阶段之后,我已经有了一个算法来处理列。我只需要一个算法来创建根据这三列分组的数据帧。

在我的情况下,重要的是像dplyr函数一样保留序列。

我们在pandas数据框架中有类似内容吗?

1 个答案:

答案 0 :(得分:0)

Grouped = df.groupby(['a','b'])

阅读更多关于pandas文档中“split-apply-combine”策略的信息,了解pandas如何处理这些问题与R相比。

从您的评论中,您似乎想要分配分组的帧。您可以通过API使用groupbyobject,例如grouped.mean(),也可以遍历groupby对象。您将在每个循环中获得名称和组。