用很多箱线图创建一个图

时间:2019-12-11 11:39:13

标签: r boxplot

我有46个测试,有60个人回答了。我为每个测试创建了两个变量:正确答案的比例和完成测试所花费的时间。

一个数据集的例子看起来像这样(有很多不适用值,因为测试是随机分配给人们的,所以并不是每个人都做每个测试)。 “ _correct”列是正确答案比例的变量。在该数据集下方,您可以看到时间变量的另一个示例。

"Acronym": "SGML"
   etc001_correct etc002_correct etc003_correct etc004_correct etc005_correct
1              NA             NA             NA      0.7500000             NA
2              NA             NA             NA      0.6250000             NA
3              NA             NA             NA             NA             NA
4              NA             NA             NA             NA             NA
5       0.7500000             NA             NA      0.6250000             NA
6              NA             NA             NA             NA          0.500
7              NA      0.2500000             NA             NA             NA
8              NA      0.2222222      1.0000000             NA          0.625
9              NA             NA      0.6666667             NA             NA
10             NA             NA             NA             NA             NA
11             NA      0.5555556             NA             NA          1.000
12      0.8333333             NA             NA      0.7500000             NA
13             NA      0.5000000             NA      0.6250000             NA
14      0.4444444             NA             NA             NA             NA
15             NA             NA             NA             NA          0.500
16      0.8333333      0.3333333             NA             NA             NA
17      0.5714286             NA             NA             NA             NA
18             NA             NA             NA             NA             NA
19      0.5833333      0.8888889             NA             NA             NA
20             NA             NA      0.9166667             NA             NA
21             NA      0.2500000      0.9166667             NA          0.750
22             NA      0.4444444             NA      0.7500000             NA
23             NA      0.6250000             NA             NA             NA
24             NA      0.4444444             NA      0.3750000             NA
25             NA             NA             NA      0.0000000             NA
26             NA             NA             NA             NA             NA
27             NA      0.5555556      1.0000000      0.7500000             NA
28             NA             NA             NA             NA             NA
29             NA      0.4444444             NA             NA             NA
30             NA             NA      0.9166667             NA          0.625
31             NA             NA             NA             NA             NA
32             NA             NA             NA             NA          0.875
33             NA             NA             NA      1.0000000          0.600
34      0.9166667             NA             NA             NA             NA
35      0.9166667             NA             NA             NA          0.875
36             NA             NA             NA      0.6666667             NA
37             NA             NA             NA             NA             NA
38             NA             NA             NA             NA             NA
39      0.9166667             NA             NA      1.0000000             NA
40             NA             NA             NA      0.5000000             NA
41             NA      0.1111111             NA             NA             NA
42             NA      0.3750000             NA             NA             NA
43             NA             NA             NA             NA             NA
44      0.7500000             NA      0.9166667             NA             NA
45      0.3333333             NA             NA             NA             NA
46             NA             NA             NA             NA             NA

现在,我想用箱形图创建一个图(或者最后,我想尝试一些小提琴),最终看起来像这样: click to see picture 左边是所有46个测试的所有箱形图,用于正确的变量,右边是时间变量。

我遇到了以下命令:

> structure(lat)
   etc001_lat etc002_lat  etc003_lat etc004_lat etc005_lat
1          NA         NA          NA  9.2609500         NA
2          NA         NA          NA 10.0296000         NA
3          NA         NA          NA         NA         NA
4          NA         NA          NA         NA         NA
5   21.577800         NA          NA 10.6118667         NA
6          NA         NA          NA         NA  9.3579833
7          NA  2.3638333          NA         NA         NA
8          NA 13.0970667  8.09376667         NA  8.2541667
9          NA         NA  7.46250000         NA         NA
10         NA         NA          NA         NA         NA
11         NA 13.8035500          NA         NA  8.0143833
12   8.993000         NA          NA 11.9346833         NA
13         NA  0.6298333  0.01903333  7.8283667         NA
14   9.661300         NA          NA         NA         NA
15         NA         NA          NA         NA  3.0293667
16  21.695567  1.6202500          NA         NA         NA
17   9.733300         NA          NA         NA         NA
18         NA         NA          NA         NA         NA
19  16.519950  9.8838833          NA         NA  0.0127000
20         NA         NA 14.21896667         NA         NA
21         NA  1.6322333  4.84566667         NA  6.0779167
22         NA 13.0713000          NA  7.2983500         NA
23         NA 11.3941000          NA         NA         NA
24         NA  9.6804000          NA  2.2148000         NA
25         NA         NA          NA  0.4631167         NA
26         NA         NA          NA         NA         NA
27         NA 10.0820500  7.16955000  9.9595500         NA
28         NA         NA          NA         NA         NA
29         NA 11.8439833          NA         NA         NA
30         NA         NA  7.46453333         NA  5.0879500
31         NA         NA          NA         NA         NA
32         NA         NA          NA         NA 10.4992833
33         NA         NA          NA  3.3057500  8.1305333
34  12.201367         NA          NA         NA         NA
35   8.903617         NA          NA         NA 11.2847667
36         NA         NA          NA  4.3811667         NA
37         NA         NA          NA         NA         NA
38         NA         NA          NA         NA         NA
39   9.218683         NA          NA 21.3696667         NA
40         NA         NA          NA  5.8727333         NA
41         NA  6.6626667          NA         NA         NA
42         NA 10.0091500          NA         NA         NA
43         NA         NA          NA         NA         NA
44   9.529750         NA  6.39453333  0.4677833         NA
45  19.196633         NA          NA         NA         NA
46         NA         NA          NA         NA         NA
47  16.214917         NA          NA  6.9361667         NA
48         NA 14.5876500          NA         NA         NA
49   9.401017 10.1663500  8.91665000         NA         NA
50         NA         NA  7.86943333         NA  8.2375500
51         NA         NA          NA         NA         NA
52   8.177333  9.1952000          NA 11.3510000         NA
53   6.979533 12.0135167          NA         NA         NA
54         NA         NA          NA         NA 10.0879667
55  17.278133         NA          NA  0.2212500         NA
56         NA  0.1282667          NA  6.0254667  0.4099667
57   3.807067         NA          NA  5.8946333  6.9164000
58         NA         NA          NA         NA         NA
59         NA         NA          NA         NA  8.5438500
60   3.339417         NA          NA 14.7733667         NA

或这个:

ggplot(dat_de, aes(x=as.factor(etc001_correct), y=)) + 
  geom_boxplot(fill="slateblue", alpha=0.2) + 
  xlab("cyl")

但是我不知道如何定义我的x轴只是变量名,而y轴是正确答案的数量或花费的时间的值。

如果有人可以帮助我,我将不胜感激!

1 个答案:

答案 0 :(得分:0)

下面是一些代码,可以帮助您创建箱形图并使用ggplot在y轴上绘制类别变量的值:

# sample data mtcars
head(mtcars)

library(ggplot2)

 # adding a group
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg))+
  geom_boxplot()

# adding a colour
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg, colour = factor(carb)))+
  geom_boxplot()


# adding a facet
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg))+
  geom_boxplot() +
  facet_grid(~factor(carb))