假设我有一个包含4列的数据框:
数据框按国家,眼睛颜色和年份排序
我想计算每个国家/地区和“眼睛”颜色类别每年的增加或减少人数。
如何用熊猫轻松做到这一点?
谢谢!
答案 0 :(得分:0)
代码:
Country_grp = df.group_by(['Country'])
Country_grp = Country_grp.get_group('India')
Country_grp[Country_grp.Eyescolor == 'Black', 'Year'].plot()
要在一张图中获得所有EyesColor:
代码:
Country_grp = df.group_by(['Country'])
Country_grp = Country_grp.get_group('India')
Country_grp['Year'].plot()
说明: 您可以在图表中看到年份的增加和减少。
首先创建一组县:
Country_grp = df.group_by(['Country'])
因此,我创建了新的数据框Counrty_grp,该数据框按数据框中的“国家/地区”列分组。
如果只想获取与特定国家/地区相对应的行,则同样如此:
Country_grp = Country_grp.get_group('India')
您现在可以将眼睛颜色的滤镜应用于数据框:
Country_grp[Country_grp.Eyes color == 'Black', 'Year']
“上方”过滤器会获取眼睛颜色为黑色的年份。