R(Hmisc)中的Cut2尊重切割点

时间:2015-11-27 20:20:04

标签: r

我对cut2中来自Hmisc R的{​​{1}}的连续变量的分箱有疑问,为什么在某些情况下切割点的处理方式不同。

我知道这个question,尤其是Christopher Bottoms的回答,但它并没有解决我为什么cut2似乎不尊重在某些情况下提供给它的切点的问题。

鉴于

v<-seq(1:12)
v

我想提供一个切割点列表(a,b,c ..,y,z),并将数字变量分箱到[-Inf,b),[b,c),... [[...] Y,Inf文件]

这似乎工作正常。

    cuts<-cut2(v,g = 4,onlycuts = TRUE)
    cuts[1]<- -Inf
    cuts[length(cuts)]<- Inf 
    cuts
    > cuts
    [1] -Inf    4    7   10  Inf

table(cut2(v,cuts = cuts))
> table(cut2(v,cuts = cuts))

[-Inf,   4) [   4,   7) [   7,  10) [  10, Inf] 
          3           3           3           3 

但不是这个。如何根据用户定义的规则完成分箱?

cuts<-cut2(v,g = 7,onlycuts = TRUE)
cuts[1]<- -Inf
cuts[length(cuts)]<- Inf 
cuts

> cuts
[1] -Inf    3    5    7    8   10  Inf

table(cut2(v,cuts = cuts))

> table(cut2(v,cuts = cuts))

[-Inf,   3) [   3,   5) [   5,   7)           7 [   8,  10) [  10, Inf] 
          2           2           2           1           2           3 

0 个答案:

没有答案