ggplot geom_histogram在Python和R

时间:2017-10-05 19:38:56

标签: python r ggplot2 histogram

我正在尝试进行一些探索性数据分析,并且我有一个带有整数年龄列和"类别"的数据框。柱。制作年龄的直方图很容易。我想要做的是保持这个年龄直方图,但根据分类变量为条形图着色。

import numpy as np 
import pandas as pd
ageSeries.hist(bins=np.arange(-0.5, 116.5, 1))

我能够在R

中使用ggplot2在一行中轻松完成我想要的操作
ggplot(data, aes(x=Age, fill=Category)) + geom_histogram(binwidth = 1)

ggplot histogram in R that properly displays totals

我无法在Python中找到一个好的解决方案,但后来我意识到有一个用于Python的ggplot2库并安装了它。我试着做同样的ggplot命令...

ggplot(data, aes(x="Age", fill="Category")) + geom_histogram(binwidth = 1)

ggplot histogram in Python, data are overlaid separately and not stacked

查看这些结果,我们可以看到不同的类别被视为不同的系列,并且重叠而不是堆叠。我不想搞乱交易,我仍然希望保持人口的整体分布。

这是我可以使用ggplot调用中的参数修复的东西,还是有一种简单的方法可以在Python中执行此操作而无需进行大量额外的数据帧操作?

0 个答案:

没有答案