我有这个数据框:
this.style.loadingSpinner.color
我做了一个小组。结果是一个多索引列
df = pd.DataFrame({'col1': ['A', 'A', 'B', 'B', 'B'], 'col2': ['A1', 'B1', 'B1', 'B1', 'A1']})
col1 col2
0 A A1
1 A B1
2 B B1
3 B B1
4 B A1
然后,我从seaborn图书馆做了一个联合剧情
df = df.groupby(['col1']).agg({'col2': ['nunique','count']})
col2
nunique count
col1
A 2 2
B 2 3
我收到了这个错误
sns.jointplot(x=['col2','nunique'],y=['col2','count'],data=df,kind='scatter')
我的问题是:
有没有办法将multiindex列拆分成两个单独的列?
TypeError: only integer scalar arrays can be converted to a scalar index
或
有没有办法联合绘制多索引列?
谢谢你的帮助!
答案 0 :(得分:0)
您可以通过在列表中指定列col2
来更改聚合,并在agg
中仅使用聚合函数来避免列中的MultiIndex
:
df = df.groupby(['col1'])['col2'].agg(['nunique','count'])
print(df)
nunique count
col1
A 2 2
B 2 3
sns.jointplot(x='nunique', y='count', data=df, kind='scatter')
如果需要在MultiIndex
中使用dictinary
,请展平agg
- 例如汇总另一栏:
df = df.groupby(['col1']).agg({'col2': ['nunique','count'], 'col1':['min']})
df.columns = df.columns.map('_'.join)
print (df)
col1_min col2_nunique col2_count
col1
A A 2 2
B B 2 3