我有一个数据集,其中包含42840个观测值,总共有119个唯一月(Dataset $ date)。我的想法是我想在每个月内为每个数据集$ Value分配一个分位数,并将它们从1(最低值)“排名”到5(最高值)。
Date Name(ID) Value Quantile (I want to add this column where i assign the values a quantile from 1 to 5)
2009-03 1 35 (1-5)
2009-04 1 20 ...
2009-05 1 65 ...
2009-03 2 24 ...
2009-04 2 77 ...
2009-03 3 110 ...
.
.
.
2018-12 3 125 ...
2009-03 56 24 ...
2009-04 56 65 ...
2009-03 57 26 ...
2009-04 57 67 ...
2009-03 58 99 ...
我尝试使用Ntile函数,该函数对整个数据集都适用,但是似乎没有一个函数可以指定日期的子集。
有什么建议吗?
答案 0 :(得分:0)
您可以将基础rank
函数与dplyr
的{{1}}一起使用:
group_by