Question

好的，我有以下数据：

> head(scores1,n=15)
       alt cat_name disorder  GS
8    V825I     Poly   0.0253  29
14  D2365N     Poly   0.2715  23
20    R43C      VLP   0.0123 180
34   P147L      VLP   0.1424  98
37   P186L      VLP   0.4441  98
40   G210V      VLP   0.2129 109
47   P248L      Mut   0.0092  98
52   R280C      VLP   0.0483 180
55   R288K      VLB   0.0414  26
56   E292V      Mut   0.0253 121
63   A414T      Mut   0.0062  58
68   A501E      VLB   0.4725 107
78   R589Q     Poly   0.2258  43
98   H778R     Poly   0.4409  29
111  D953N      VLB   0.1048  23
> tail(scores1,n=15)
         alt cat_name disorder  GS
54219  G191V     Poly   0.0120 109
54221 R1111L      Mut   0.2364 102
54227  I125R     Poly   0.1671  97
54228  K197R     Poly   0.5456  26
54229  N220K     Poly   0.6322  94
54232  E249A     Poly   0.6661 107
54234  C301R     Poly   0.5620 180
54235  D315E     Poly   0.5992  45
54239  A666V     Poly   0.2503  64
54246 G3631R     Poly   0.8623 125
54252  R300Q     Poly   0.3807  43
54253  T343M     Poly   0.1969  81
54268    A3V     Poly   0.9593  64
54270  G117V     Poly   0.4901 109
54271  R152H      VLB   0.3529  29

我运行以下代码来根据GS对数据进行分区并按cat_name分组，然后输出一个图：

> ggplot (scores1, aes(GS, fill = cat_name)) + geom_histogram(binwidth = 20)

我得到以下情节：

我想要的是一个图表，其中每个箱子的总高度标准化为1，这样我就可以看到每个箱子中每个类别的相对比率，而不是计数。

思想？

ggplot直方图，总箱数相等

0 个答案: