进行rfm分析。我想把排名除以5.我已经做好了。问题是当我在frequency
部分尝试分位数函数5时,如果他们经常以5级购买,那么将买家划分为“伟大的客户”,如果他们购买较少的等级(等级4)则为“好”事实上,大量购买者一年购买1次这样的事实就像这样的分位数:
f=quantile(cust$freq,probs=seq(0,1,0.20))
0% 20% 40% 60% 80% 100%
1 1 1 2 4 170
所以我尝试了独特的价值,但结果不会考虑有这种习惯的人的频率所以这是不对的,因为大多数人都必须考虑这一点。
无论如何,频率的分布如下:
table(cust$freq)
1 2 3 4 5 6 7 8 9 10 11 12 13
68949 32476 18125 11363 7646 5248 3594 2503 1922 1359 1061 778 595
14 15 16 17 18 19 20 21 22 23 24 25 26
433 348 275 221 171 104 94 74 54 59 36 37 23
27 28 29 30 31 32 33 34 35 36 37 38 39
15 21 26 13 11 11 10 6 8 1 7 5 1
40 41 42 43 45 46 47 48 53 57 60 73 94
4 4 4 4 2 2 1 1 1 1 1 1 1
170
1
问题是如何通过考虑两者这一事实很多的人在一年中购买一次,而且还关注大范围的人们的习惯显示每个四分位数的不同天数(频率),以便客户从5到1之后排名。