具有大量相同值的公平分位数?

时间:2018-02-17 11:55:45

标签: r statistics frequency

进行rfm分析。我想把排名除以5.我已经做好了。问题是当我在frequency部分尝试分位数函数5时,如果他们经常以5级购买,那么将买家划分为“伟大的客户”,如果他们购买较少的等级(等级4)则为“好”事实上,大量购买者一年购买1次这样的事实就像这样的分位数:

f=quantile(cust$freq,probs=seq(0,1,0.20))


  0%  20%  40%  60%  80% 100% 
   1    1    1    2    4  170 

所以我尝试了独特的价值,但结果不会考虑有这种习惯的人的频率所以这是不对的,因为大多数人都必须考虑这一点。

无论如何,频率的分布如下:

table(cust$freq)

 1     2     3     4     5     6     7     8     9    10    11    12    13 
68949 32476 18125 11363  7646  5248  3594  2503  1922  1359  1061   778   595 
   14    15    16    17    18    19    20    21    22    23    24    25    26 
  433   348   275   221   171   104    94    74    54    59    36    37    23 
   27    28    29    30    31    32    33    34    35    36    37    38    39 
   15    21    26    13    11    11    10     6     8     1     7     5     1 
   40    41    42    43    45    46    47    48    53    57    60    73    94 
    4     4     4     4     2     2     1     1     1     1     1     1     1 
  170 
    1 

问题是如何通过考虑两者这一事实很多的人在一年中购买一次,而且还关注大范围的人们的习惯显示每个四分位数的不同天数(频率),以便客户从5到1之后排名。

0 个答案:

没有答案