具有2个分类变量且在R中连续1个的折线图

时间:2015-03-16 16:31:25

标签: r ggplot2 categorical-data linegraph

我对R和一般的统计数据都很陌生。我试图在线图中绘制2个分类变量(词性和#34; pos",条件" trcond")和数字1(得分" totacc")在ggplot2。

> df1<-df[, c("trcond", "subtitle", "pos", "totacc")]
> head(df1)
   trcond     subtitle pos totacc
7       L New Scene_16 lex  0.250
29      N New Scene_16 lex  0.500
8       L New Scene_25 lex  0.875
30      N New Scene_25 lex  0.666
9       L New Scene_29 lex  1.000
31      N New Scene_29 lex  0.833

我使用过这个ggplot2命令:

>ggplot(data=summdfo, aes(x=pos, y=totacc, group=trcond, colour=trcond))
+ geom_line() + geom_point()

但它不起作用,图表在整个地方都有彩色(蓝色和红色)点,而不仅仅是连接它们的两条线。我想发布我得到的图表,因为我缺乏解释的话,但这是我的第一篇文章,我似乎无法上传图片。

我想得到一个标准的简单2线图,例如本页中的蓝色和红色图(其中y =总账单,x =时间(午餐,晚餐)按性别分组):{{3} }

这可能与我的数据集完全相同吗?如果是这样,我的代码是做错了什么?

1 个答案:

答案 0 :(得分:5)

在这里,我尝试根据您数据中的有限样本创建数据框。

df1 <- data.frame(trcond=rep(c('L', 'N'), 3), 
                  subtitle=rep('New Scene_29', 6),  # Not in use, just a dummy
                  pos=c('lex', 'lex', 'lex', 'noLex', 'noLex', 'noLex'), 
                  totacc=c(0.250, 0.5, 0.875, 0.666, 1.000, 0.833))

因为这个数据帧中的trcond不平衡,所以情节会像这样混乱:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line() + 
  geom_point()

enter image description here 但是,如果您应用将为每个条件计算均值的汇总函数,则会显示正确的图:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line(stat='summary', fun.y='mean') + 
  geom_point(stat='summary', fun.y='mean')

enter image description here 同样,这是试图找出数据中的内容。最好的是,您在这里使用dput(head(df1,50))提供数据样本,以便为您提供更好的答案。