按中位数拆分数据框

时间:2018-01-11 05:16:47

标签: r

我想将我的数据集分成两个子集,其中一半包含低于中位数的所有值,另一半包含高于中位数的值。

问题:我的数据集有多个观察值,其值与中位数相同。因此,

v <- c(1,2,3,3,3,3,3,4)
med <- median(v)
upper <- v[which(v >= med)]
lower <- v[which(v <= med)]

不起作用,因为等于中位数的值将出现在两组中并且过多。

我的预期输出是

lower: 1,2,3,3
upper: 3,3,3,4

如何将数据帧除以R中的中位数?

2 个答案:

答案 0 :(得分:4)

根据您的要求,我们只需要将排序后的矢量分成两半。但是,我们需要考虑具有奇数个元素的情况,因此我们使用round(length(v))来获取奇数长度向量的最接近的整数元素:

v <- sort(v)
lower <- v[1:round(length(v)/2)] 
upper <- v[round((length(v)/2)+1):length(v)] 

lower
[1] 1 2 3 3
upper
[1] 3 3 3 4

答案 1 :(得分:2)

此解决方案适用于数据框架。

df <- df[order(df$var),] 
med <- median(df$var) 
lower <- df[1:round(nrow(df)/2),] 
upper <- df[round((nrow(df)/2)+1):nrow(df),]

Mako212显示该方法有效。看他/她的帖子。