我现在正在努力奋斗几天。现在这是关于同一主题的stackoverflow的第3个问题,希望这次我的问题得到更好的定义。
我的数据分布如下: (复制数据):
datag <- data.frame(Probability=rgamma(10000, shape=0.6, rate=4.8, scale=1/4.8))
datag <- subset(datag, Probability<=1)
数据代表概率:从0到1.
我想明智地将状态1到状态10的状态分配给概率范围。
这就是我所拥有的:
Interval <- round(quantile(datag, c(seq(0,1,by=0.10))),3)
输出:
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
0.000 0.008 0.015 0.024 0.036 0.054 0.080 0.124 0.209 0.397 1.000
指定0到10之间的状态:
States <- data.frame(datag, State=findInterval(datag, Interval))
头(美国)
输出:状态
Probability State
0.20585012 8
0.21202839 9
0.07087725 6
0.7109513 10
0.9641807 10
问题在于:正如您在上面所看到的,我已经说明了概率为0.2120的状态9和状态10的&gt; 0.710。我会很高兴看到prob = 0.2120状态4和prob = 0.710状态7和prob = 0.96 =状态10。
那么如何更统一地分配状态?