我有46个测试,有60个人回答了。我为每个测试创建了两个变量:正确答案的比例和完成测试所花费的时间。
一个数据集的例子看起来像这样(有很多不适用值,因为测试是随机分配给人们的,所以并不是每个人都做每个测试)。 “ _correct”列是正确答案比例的变量。在该数据集下方,您可以看到时间变量的另一个示例。
"Acronym": "SGML"
etc001_correct etc002_correct etc003_correct etc004_correct etc005_correct
1 NA NA NA 0.7500000 NA
2 NA NA NA 0.6250000 NA
3 NA NA NA NA NA
4 NA NA NA NA NA
5 0.7500000 NA NA 0.6250000 NA
6 NA NA NA NA 0.500
7 NA 0.2500000 NA NA NA
8 NA 0.2222222 1.0000000 NA 0.625
9 NA NA 0.6666667 NA NA
10 NA NA NA NA NA
11 NA 0.5555556 NA NA 1.000
12 0.8333333 NA NA 0.7500000 NA
13 NA 0.5000000 NA 0.6250000 NA
14 0.4444444 NA NA NA NA
15 NA NA NA NA 0.500
16 0.8333333 0.3333333 NA NA NA
17 0.5714286 NA NA NA NA
18 NA NA NA NA NA
19 0.5833333 0.8888889 NA NA NA
20 NA NA 0.9166667 NA NA
21 NA 0.2500000 0.9166667 NA 0.750
22 NA 0.4444444 NA 0.7500000 NA
23 NA 0.6250000 NA NA NA
24 NA 0.4444444 NA 0.3750000 NA
25 NA NA NA 0.0000000 NA
26 NA NA NA NA NA
27 NA 0.5555556 1.0000000 0.7500000 NA
28 NA NA NA NA NA
29 NA 0.4444444 NA NA NA
30 NA NA 0.9166667 NA 0.625
31 NA NA NA NA NA
32 NA NA NA NA 0.875
33 NA NA NA 1.0000000 0.600
34 0.9166667 NA NA NA NA
35 0.9166667 NA NA NA 0.875
36 NA NA NA 0.6666667 NA
37 NA NA NA NA NA
38 NA NA NA NA NA
39 0.9166667 NA NA 1.0000000 NA
40 NA NA NA 0.5000000 NA
41 NA 0.1111111 NA NA NA
42 NA 0.3750000 NA NA NA
43 NA NA NA NA NA
44 0.7500000 NA 0.9166667 NA NA
45 0.3333333 NA NA NA NA
46 NA NA NA NA NA
现在,我想用箱形图创建一个图(或者最后,我想尝试一些小提琴),最终看起来像这样: click to see picture 左边是所有46个测试的所有箱形图,用于正确的变量,右边是时间变量。
我遇到了以下命令:
> structure(lat)
etc001_lat etc002_lat etc003_lat etc004_lat etc005_lat
1 NA NA NA 9.2609500 NA
2 NA NA NA 10.0296000 NA
3 NA NA NA NA NA
4 NA NA NA NA NA
5 21.577800 NA NA 10.6118667 NA
6 NA NA NA NA 9.3579833
7 NA 2.3638333 NA NA NA
8 NA 13.0970667 8.09376667 NA 8.2541667
9 NA NA 7.46250000 NA NA
10 NA NA NA NA NA
11 NA 13.8035500 NA NA 8.0143833
12 8.993000 NA NA 11.9346833 NA
13 NA 0.6298333 0.01903333 7.8283667 NA
14 9.661300 NA NA NA NA
15 NA NA NA NA 3.0293667
16 21.695567 1.6202500 NA NA NA
17 9.733300 NA NA NA NA
18 NA NA NA NA NA
19 16.519950 9.8838833 NA NA 0.0127000
20 NA NA 14.21896667 NA NA
21 NA 1.6322333 4.84566667 NA 6.0779167
22 NA 13.0713000 NA 7.2983500 NA
23 NA 11.3941000 NA NA NA
24 NA 9.6804000 NA 2.2148000 NA
25 NA NA NA 0.4631167 NA
26 NA NA NA NA NA
27 NA 10.0820500 7.16955000 9.9595500 NA
28 NA NA NA NA NA
29 NA 11.8439833 NA NA NA
30 NA NA 7.46453333 NA 5.0879500
31 NA NA NA NA NA
32 NA NA NA NA 10.4992833
33 NA NA NA 3.3057500 8.1305333
34 12.201367 NA NA NA NA
35 8.903617 NA NA NA 11.2847667
36 NA NA NA 4.3811667 NA
37 NA NA NA NA NA
38 NA NA NA NA NA
39 9.218683 NA NA 21.3696667 NA
40 NA NA NA 5.8727333 NA
41 NA 6.6626667 NA NA NA
42 NA 10.0091500 NA NA NA
43 NA NA NA NA NA
44 9.529750 NA 6.39453333 0.4677833 NA
45 19.196633 NA NA NA NA
46 NA NA NA NA NA
47 16.214917 NA NA 6.9361667 NA
48 NA 14.5876500 NA NA NA
49 9.401017 10.1663500 8.91665000 NA NA
50 NA NA 7.86943333 NA 8.2375500
51 NA NA NA NA NA
52 8.177333 9.1952000 NA 11.3510000 NA
53 6.979533 12.0135167 NA NA NA
54 NA NA NA NA 10.0879667
55 17.278133 NA NA 0.2212500 NA
56 NA 0.1282667 NA 6.0254667 0.4099667
57 3.807067 NA NA 5.8946333 6.9164000
58 NA NA NA NA NA
59 NA NA NA NA 8.5438500
60 3.339417 NA NA 14.7733667 NA
或这个:
ggplot(dat_de, aes(x=as.factor(etc001_correct), y=)) +
geom_boxplot(fill="slateblue", alpha=0.2) +
xlab("cyl")
但是我不知道如何定义我的x轴只是变量名,而y轴是正确答案的数量或花费的时间的值。
如果有人可以帮助我,我将不胜感激!
答案 0 :(得分:0)
下面是一些代码,可以帮助您创建箱形图并使用ggplot在y轴上绘制类别变量的值:
# sample data mtcars
head(mtcars)
library(ggplot2)
# adding a group
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg))+
geom_boxplot()
# adding a colour
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg, colour = factor(carb)))+
geom_boxplot()
# adding a facet
ggplot(data = mtcars, aes(x = factor(cyl), y = mpg))+
geom_boxplot() +
facet_grid(~factor(carb))