Question

我正在尝试进行一些探索性数据分析，并且我有一个带有整数年龄列和＆＃34;类别＆＃34;的数据框。柱。制作年龄的直方图很容易。我想要做的是保持这个年龄直方图，但根据分类变量为条形图着色。

import numpy as np 
import pandas as pd
ageSeries.hist(bins=np.arange(-0.5, 116.5, 1))

我能够在R

中使用ggplot2在一行中轻松完成我想要的操作

ggplot(data, aes(x=Age, fill=Category)) + geom_histogram(binwidth = 1)

ggplot histogram in R that properly displays totals

我无法在Python中找到一个好的解决方案，但后来我意识到有一个用于Python的ggplot2库并安装了它。我试着做同样的ggplot命令...

ggplot(data, aes(x="Age", fill="Category")) + geom_histogram(binwidth = 1)

ggplot histogram in Python, data are overlaid separately and not stacked

查看这些结果，我们可以看到不同的类别被视为不同的系列，并且重叠而不是堆叠。我不想搞乱交易，我仍然希望保持人口的整体分布。

这是我可以使用ggplot调用中的参数修复的东西，还是有一种简单的方法可以在Python中执行此操作而无需进行大量额外的数据帧操作？