我有一个数据集,其中包含一列subcat和winning_price。我有以下代表代码。
subcat=c(102,141,142)
subcat=rep(subcat,each=8)
winning_price=c(19050,19350,19900,20550,21100,21200)
winning_price=rep(winning_price,4)
ndata=data.frame(subcat,winning_price)
我已使用以下代码计算了每个子猫的Q1,Q2和Q3:
n=ndata %>%
group_by(subcat) %>%
group_modify(~{
quantile(.x$winning_price, probs = c(0.25, 0.50,0.75)) %>%
tibble::enframe()
})
#adding an quartile column
n$Quantile=ifelse(n$name=="25%","Q1",ifelse(n$name=="50%","Q2",ifelse(n$name=="75%","Q3",0)))
输出看起来像这样:
问题是我需要创建一个数据集,其中包含每个子目录中的行数和百分位值。那是给子猫的 a)102,第1季度的存储桶为<= 19275; Q2在19275和19625之间;第三季度在19625至20687.5之间; Q4> = 20687.5 b)141,Q1的存储桶<= 19762.5; Q2在19762.5和20225之间;第三季度在20225至20687.5之间; Q4> = 20687.5 c)142,Q1的桶≤19762.5,Q2在19762.5和20825之间;第三季度在20825至21125之间; Q4是> = 21125
实际数据集应为:
预期数据集:
谢谢!