这可能是一个具有简单修复程序的简单问题,但是由于某些原因,我似乎无法正确解决。我正在尝试针对2个类别(1或2)的类别变量“ yr”绘制连续变量“ cnt”。数据大致分为第一年和第二年的一半。
当我尝试以下代码比较两年内的箱形图时,却得到以下图表:
ggplot(data=rawd,aes(x=yr,y=cnt, color=yr))+
geom_boxplot()+
labs(x='Year', y= 'Hourly Usage Count')
我不确定为什么会这样。当我尝试以任何其他格式(例如使用抖动或geom_point)可视化它时,yr = 1和yr = 2之间有明显的区别(请参见下文) 在R上使用简单的boxplot命令时,我也遇到了一个问题,我得到以下曲线:
boxplot(rawd$yr, rawd$cnt)
如果有人可以看到我在做什么错,请告诉我。
答案 0 :(得分:0)
如评论中所述,将有问题的“ yr”列改为“ factor”似乎可以解决