使用groupby在多列上的Value_counts

时间:2018-08-24 19:04:57

标签: python pandas pandas-groupby

我需要有关熊猫的一些帮助。

我有以下数据框:

df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
               '2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
               'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
               'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
               'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})

screenshot

我试图在前两列groupby1Country上进行2City,并在列value_countsF1上进行F2。到目前为止,我只能一次在1列上进行groupby和value_counts

df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)

如何在多列上执行value_counts并得到datframe?

2 个答案:

答案 0 :(得分:4)

您可以使用agg,类似于以下内容:

df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})

               F1   F2   F3
FR  Paris  A  2.0  1.0  2.0
           B  1.0  1.0  NaN
           C  NaN  1.0  1.0
GER Berlin A  NaN  2.0  NaN
           B  2.0  1.0  2.0
           C  1.0  NaN  1.0
IT  Rome   B  1.0  1.0  NaN
           C  2.0  2.0  3.0

答案 1 :(得分:3)

您可以按照以下方式将字典传递给agg

df.groupby(['1Country', '2City']).agg({'F1': 'value_counts', 'F2': 'value_counts'})