我正在研究具有以下样本数据的pandas dataframe(df):
0 Dec-16 N
1 Jan-17 N
2 Feb-17 Y
3 Feb-17 N
4 Jan-17 N
5 Mar-17 Y
6 Mar-17 Y
7 Jan-17 N
8 Jan-17 Y
使用
df_group = df.groupby(['MMM-YY', 'Valid'])
我的输出低于输出:
MMM-YY Valid
Dec-16 N 1
Feb-17 N 1
Y 1
Jan-17 N 3
Y 1
Mar-17 Y 2
我想使用这些数据创建一个条形图(以Y& N显示%年龄的条形图),但遗憾的是无法实现这一点。我试图将上面的输出转换为新的数据帧,但没有运气。
任何解决这个问题的指针都会非常感激。
答案 0 :(得分:2)
我认为您需要crosstab
每行normalize
+ DataFrame.plot.bar
:
df_group = df = pd.crosstab(df['MMM-YY'], df['Valid'], normalize=0)
print (df_group)
Valid N Y
MMM-YY
Dec-16 1.00 0.00
Feb-17 0.50 0.50
Jan-17 0.75 0.25
Mar-17 0.00 1.00
df_group.plot.bar()
如果需要按列进行标准化:
df_group1 = df = pd.crosstab(df['MMM-YY'], df['Valid'], normalize=1)
print (df_group1)
Valid N Y
MMM-YY
Dec-16 0.2 0.00
Feb-17 0.2 0.25
Jan-17 0.6 0.25
Mar-17 0.0 0.50
df_group1.plot.bar()
如果只需要计数值:
df1 = df = pd.crosstab(df['MMM-YY'], df['Valid'])
print (df1)
Valid N Y
MMM-YY
Dec-16 1 0
Feb-17 1 1
Jan-17 3 1
Mar-17 0 2
df1.plot.bar()