python ggplot geom_bar y轴不正确的值

时间:2017-03-19 18:26:36

标签: python ggplot2 python-ggplot

df

duration status    line
75526    Good      A
75526    Muy buen  B
75546    pas mal   C
75516    loco      D

我正在密谋:

p = ggplot(aes(x='status',weight='duration',fill='line'),data=df) + geom_bar(stat='identity')

重要的是,我使用stat='identity'来确保y轴是列值而不是密度测量值。然而,它显示的y-axis值不正确。

我可以计算最大duration值,并且我看到它在86,000标记附近(即以秒为单位的24小时)。为什么图表显示的秒数超过250,000

enter image description here

2 个答案:

答案 0 :(得分:1)

此图将按statusline对数据框进行分组,并使用每个组中的持续时间总和(也称为权重)作为条形高度。有些团体必须有多个条目,这就是这些额外的高杠来自的地方。

答案 1 :(得分:0)

我猜测你提供的信息不完整。

您希望限制y轴,因为您可以使用ylim方法 ylim(low=0, high=864000) 因此,您的命令将显示为

p = ggplot(aes(x='status',weight='duration',fill='line'),data=df) + geom_bar(stat='identity') + ylim(low=0, high=864000)

如果这是正确的,请告诉我。

干杯