好的,我有以下数据:
> head(scores1,n=15)
alt cat_name disorder GS
8 V825I Poly 0.0253 29
14 D2365N Poly 0.2715 23
20 R43C VLP 0.0123 180
34 P147L VLP 0.1424 98
37 P186L VLP 0.4441 98
40 G210V VLP 0.2129 109
47 P248L Mut 0.0092 98
52 R280C VLP 0.0483 180
55 R288K VLB 0.0414 26
56 E292V Mut 0.0253 121
63 A414T Mut 0.0062 58
68 A501E VLB 0.4725 107
78 R589Q Poly 0.2258 43
98 H778R Poly 0.4409 29
111 D953N VLB 0.1048 23
> tail(scores1,n=15)
alt cat_name disorder GS
54219 G191V Poly 0.0120 109
54221 R1111L Mut 0.2364 102
54227 I125R Poly 0.1671 97
54228 K197R Poly 0.5456 26
54229 N220K Poly 0.6322 94
54232 E249A Poly 0.6661 107
54234 C301R Poly 0.5620 180
54235 D315E Poly 0.5992 45
54239 A666V Poly 0.2503 64
54246 G3631R Poly 0.8623 125
54252 R300Q Poly 0.3807 43
54253 T343M Poly 0.1969 81
54268 A3V Poly 0.9593 64
54270 G117V Poly 0.4901 109
54271 R152H VLB 0.3529 29
我运行以下代码来根据GS
对数据进行分区并按cat_name
分组,然后输出一个图:
> ggplot (scores1, aes(GS, fill = cat_name)) + geom_histogram(binwidth = 20)
我得到以下情节:
我想要的是一个图表,其中每个箱子的总高度标准化为1,这样我就可以看到每个箱子中每个类别的相对比率,而不是计数。
思想?