如何添加4组来制作具有平均段的分类散点图?

时间:2015-07-30 01:02:23

标签: r ggplot2

我想在R studio中为我的数据集创建这种图形(图形图片的参考:帖子,使用R中的ggplot2的平均段的分类散点图),但是我不知道如何添加我的组,不止一个,x轴和Y轴刻度。

以下是我的数据,它作为cvs文件保存在Windows PC中:

GROUP A 
22.51506233
21.86862564
21.20981979
21.44734764
21.45001411
19.99370003
GROUP B
18.95846367
20.99542427
20.96941566
21.49574852
21.18944359
21.88916016
19.47029114
19.50328064
GROUP C
20.76145554
19.29909134
21.62098885
26.1908226
21.95579529
20.79806519
24.57015228
22.81287003
21.68307304
GROUP D
20.89354706
20.52819443
22.62171173
21.20273018
20.35452652
20.89900398
21.66306114
19.66979218
19.77578926
19.31722832
21.89787102
20.92485237
20.60872269
19.97720909
21.31039047
21.76075363
22.42200661
22.59609222
21.5938015
22.24318123
22.26913261
21.67864227
18.97455406
21.47759438

以下是必需的详细信息:

我没有尝试使用图形代码,我只是在观看视频来学习R,但遗憾的是我没有得到正确的代码来制作这样的图表。图表的链接是 Categorical scatter plot with mean segments using ggplot2 in R

我的数据是excel,我以CVS格式保存,然后我在Rstudio中导入。它在我的R窗口中存储为BCL6.DATAcvs。我读了下面的文件,它是每组一列,有4组,每组有不同数量的值,例如A有6个值,B有8个值,C有9个值,D有24个值。

summary(BCL6.DATAcvs)
       A               B               C               D        
 Min.   :19.99   Min.   :18.96   Min.   :19.30   Min.   :18.97  
 1st Qu.:21.27   1st Qu.:19.50   1st Qu.:20.80   1st Qu.:20.48  
 Median :21.45   Median :20.98   Median :21.68   Median :21.26  
 Mean   :21.41   Mean   :20.56   Mean   :22.19   Mean   :21.11  
 3rd Qu.:21.76   3rd Qu.:21.27   3rd Qu.:22.81   3rd Qu.:21.80  
 Max.   :22.52   Max.   :21.89   Max.   :26.19   Max.   :22.62  
 NA's   :18      NA's   :16      NA's   :15

请指导我如何制作此图表。

1 个答案:

答案 0 :(得分:2)

假设您有group列和value列,请先重新构建数据:

A <- data.frame(group="A", value=c(22.51506233,21.86862564,21.20981979,21.44734764,21.45001411,19.99370003))
B <- data.frame(group="B", value=c(18.95846367,20.99542427,20.96941566,21.49574852,21.18944359,21.88916016,19.47029114,19.50328064))
C <- data.frame(group="C", value=c(20.76145554,19.29909134,21.62098885,26.1908226,21.95579529,20.79806519,24.57015228,22.81287003,21.68307304))
D <- data.frame(group="D", value=c(20.89354706,20.52819443,22.62171173,21.20273018,20.35452652,20.89900398,21.66306114,19.66979218,19.77578926,19.31722832,21.89787102,20.92485237,20.60872269,19.97720909,21.31039047,21.76075363,22.42200661,22.59609222,21.5938015,22.24318123,22.26913261,21.67864227,18.97455406,21.47759438))
df <- rbind(A,B,C,D)

现在,您可以使用以下内容制作分组散点图

library(ggplot2)
ggplot(df, aes(x=group, y=value, color=group)) +
  geom_point(size=4, alpha=0.7, position=position_jitter(w=0.1, h=0)) +
  stat_summary(fun.y=mean, geom="point", shape=23, color="black", aes(fill=group), size=4) +         
  stat_summary(fun.ymin=function(x)(mean(x)-sd(x)), 
               fun.ymax=function(x)(mean(x)+sd(x)),
               geom="errorbar", width=0.1) +
  theme_bw()

结果:

enter image description here

使用参数的说明:

我将alpha=0.7position=position_jitter(w=0.1, h=0)结合使用以区分这些点。 alpha设置透明度,其值介于0(完全透明)和1(非透明)之间。

使用position_jitter,您可以稍微更改点的位置。这是在确切点的某些边界内随机完成的。这样做的原因是某些点重叠。通过使用position=position_jitter(),您可以更好地显示重叠点。边界使用wh参数设置。通过在h=0中设置position_jitter,您可以确保位置的更改只是水平发生,垂直位置与实际值完全相同。要查看效果,请运行不带position=position_jitter(w=0.1, h=0)部分的代码,并将其与上图进行比较。

theme_bw()将绘图的布局设置为黑/白布局,而不是使用灰色背景。

有关以下几个部分的详细信息:geom_pointstat_summarygeom_errorbartheme()。有关点形状的更多信息,只需在控制台中键入?pch即可。