我有一个groupby,其中纵轴是帐户状态," Good"和"坏"帐户,横轴是国家(AK,AZ ......等)我想找到各州的好坏账户比例,但我找不到如何在一个类别上运作(" Good& #34;)而不是另一个(" Bad")。
谢谢!
更多详情:
Data(contained in "df"):
astatus astate
Good AK
Bad AK
Good NY
Good GA
我的尝试:
d=df.groupby([astatus', 'astate']).size()
d=d.unstack('astate')
结果:
astate AK NY GA
astatus
Good 1 1 1
Bad 1 0 0
我看到数据集中似乎有一个趋势,所以我想按状态计算好帐户的百分比,但我不确定下一步是什么。
再次感谢!
答案 0 :(得分:0)
您需要提供有关数据结构的更多信息。一个小的测试示例也非常有用。否则,很难为你提供帮助。
一般来说,您可以对分组数据使用apply
来计算每个州的比率:sum(bads)/sum(goods)
但是,如果没有更多细节,很难提出明确的建议。