我需要有关熊猫的一些帮助。
我有以下数据框:
df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'],
'2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','Paris','Berlin','Rome'],
'F1': ['A', 'B', 'C', 'B', 'B', 'C', 'A', 'B', 'C'],
'F2': ['B', 'C', 'A', 'A', 'B', 'C', 'A', 'B', 'C'],
'F3': ['C', 'A', 'B', 'C', 'C', 'C', 'A', 'B', 'C']})
我试图在前两列groupby
和1Country
上进行2City
,并在列value_counts
和F1
上进行F2
。到目前为止,我只能一次在1列上进行groupby和value_counts
df.groupby(['1Country','2City'])['F1'].apply(pd.Series.value_counts)
如何在多列上执行value_counts
并得到datframe?
答案 0 :(得分:4)
您可以使用agg
,类似于以下内容:
df.groupby(['1Country','2City']).agg({i:'value_counts' for i in df.columns[2:]})
F1 F2 F3
FR Paris A 2.0 1.0 2.0
B 1.0 1.0 NaN
C NaN 1.0 1.0
GER Berlin A NaN 2.0 NaN
B 2.0 1.0 2.0
C 1.0 NaN 1.0
IT Rome B 1.0 1.0 NaN
C 2.0 2.0 3.0
答案 1 :(得分:3)
您可以按照以下方式将字典传递给agg
:
df.groupby(['1Country', '2City']).agg({'F1': 'value_counts', 'F2': 'value_counts'})