我想将我的数据集分成两个子集,其中一半包含低于中位数的所有值,另一半包含高于中位数的值。
问题:我的数据集有多个观察值,其值与中位数相同。因此,
v <- c(1,2,3,3,3,3,3,4)
med <- median(v)
upper <- v[which(v >= med)]
lower <- v[which(v <= med)]
不起作用,因为等于中位数的值将出现在两组中并且过多。
我的预期输出是
lower: 1,2,3,3
upper: 3,3,3,4
如何将数据帧除以R中的中位数?
答案 0 :(得分:4)
根据您的要求,我们只需要将排序后的矢量分成两半。但是,我们需要考虑具有奇数个元素的情况,因此我们使用round(length(v))
来获取奇数长度向量的最接近的整数元素:
v <- sort(v)
lower <- v[1:round(length(v)/2)]
upper <- v[round((length(v)/2)+1):length(v)]
lower
[1] 1 2 3 3
upper
[1] 3 3 3 4
答案 1 :(得分:2)
此解决方案适用于数据框架。
df <- df[order(df$var),]
med <- median(df$var)
lower <- df[1:round(nrow(df)/2),]
upper <- df[round((nrow(df)/2)+1):nrow(df),]
Mako212显示该方法有效。看他/她的帖子。