我对R和一般的统计数据都很陌生。我试图在线图中绘制2个分类变量(词性和#34; pos",条件" trcond")和数字1(得分" totacc")在ggplot2。
> df1<-df[, c("trcond", "subtitle", "pos", "totacc")]
> head(df1)
trcond subtitle pos totacc
7 L New Scene_16 lex 0.250
29 N New Scene_16 lex 0.500
8 L New Scene_25 lex 0.875
30 N New Scene_25 lex 0.666
9 L New Scene_29 lex 1.000
31 N New Scene_29 lex 0.833
我使用过这个ggplot2命令:
>ggplot(data=summdfo, aes(x=pos, y=totacc, group=trcond, colour=trcond))
+ geom_line() + geom_point()
但它不起作用,图表在整个地方都有彩色(蓝色和红色)点,而不仅仅是连接它们的两条线。我想发布我得到的图表,因为我缺乏解释的话,但这是我的第一篇文章,我似乎无法上传图片。
我想得到一个标准的简单2线图,例如本页中的蓝色和红色图(其中y =总账单,x =时间(午餐,晚餐)按性别分组):{{3} }
这可能与我的数据集完全相同吗?如果是这样,我的代码是做错了什么?
答案 0 :(得分:5)
在这里,我尝试根据您数据中的有限样本创建数据框。
df1 <- data.frame(trcond=rep(c('L', 'N'), 3),
subtitle=rep('New Scene_29', 6), # Not in use, just a dummy
pos=c('lex', 'lex', 'lex', 'noLex', 'noLex', 'noLex'),
totacc=c(0.250, 0.5, 0.875, 0.666, 1.000, 0.833))
因为这个数据帧中的trcond不平衡,所以情节会像这样混乱:
ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+
geom_line() +
geom_point()
但是,如果您应用将为每个条件计算均值的汇总函数,则会显示正确的图:
ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+
geom_line(stat='summary', fun.y='mean') +
geom_point(stat='summary', fun.y='mean')
同样,这是试图找出数据中的内容。最好的是,您在这里使用dput(head(df1,50))提供数据样本,以便为您提供更好的答案。