从r

时间:2015-10-31 12:50:52

标签: r ggplot2 subset boxplot

我有一个年龄和细胞数量的连续数据。我想按年龄对数据进行分组(例如从0-0.5,0.5-1,1-1.5个月等等......)之后我需要提出一个比较这些新数据子集的组合箱图。我试图通过将数据分成不同的数据帧(比如x1,x1,x2 ......)然后绘制boxplot(x1,x2,x3 ......)来做到这一点。我觉得我使用的过程太长而且乏味,无法完成整个数据集。有没有更简单的方法可以做到这一点?这是数据的一部分

Age_month = c(0.6242299795, 1.0513347023,1.1170431211,1.1498973306,1.3141683778,1.3470225873,1.3470225873,1.3470225873,1.3798767967,1.3798767967,
1.3798767967,1.3798767967,1.3798767967,1.4127310062,1.4784394251,1.5112936345,1.5112936345,1.5770020534,1.6098562628,1.6755646817)

Cell_cont = c(4260,1800,5674,7625,3257,5161,2913,3064,8016,3348,5415, 4370,4477,5358,3240,5899,4062,5774,3265,3167)

Dat = data.frame(Age_month, Cell_cont)

1 个答案:

答案 0 :(得分:1)

使用cut将数字向量转换为因子。我正在使用动态计算中断,这样您就不必对组边界进行硬编码。

cutAgeMonth = cut(Age_month, breaks=seq(from=0, to=ceiling(max(Age_month)), by=0.5))
Dat = data.frame(cutAgeMonth, Cell_cont)
boxplot(Cell_cont ~ cutAgeMonth)