我正在尝试进行一些探索性数据分析,并且我有一个带有整数年龄列和"类别"的数据框。柱。制作年龄的直方图很容易。我想要做的是保持这个年龄直方图,但根据分类变量为条形图着色。
import numpy as np
import pandas as pd
ageSeries.hist(bins=np.arange(-0.5, 116.5, 1))
我能够在R
中使用ggplot2在一行中轻松完成我想要的操作ggplot(data, aes(x=Age, fill=Category)) + geom_histogram(binwidth = 1)
我无法在Python中找到一个好的解决方案,但后来我意识到有一个用于Python的ggplot2库并安装了它。我试着做同样的ggplot命令...
ggplot(data, aes(x="Age", fill="Category")) + geom_histogram(binwidth = 1)
查看这些结果,我们可以看到不同的类别被视为不同的系列,并且重叠而不是堆叠。我不想搞乱交易,我仍然希望保持人口的整体分布。
这是我可以使用ggplot调用中的参数修复的东西,还是有一种简单的方法可以在Python中执行此操作而无需进行大量额外的数据帧操作?