我对cut2
中来自Hmisc
R
的{{1}}的连续变量的分箱有疑问,为什么在某些情况下切割点的处理方式不同。
我知道这个question,尤其是Christopher Bottoms的回答,但它并没有解决我为什么cut2似乎不尊重在某些情况下提供给它的切点的问题。
鉴于
v<-seq(1:12)
v
我想提供一个切割点列表(a,b,c ..,y,z),并将数字变量分箱到[-Inf,b),[b,c),... [[...] Y,Inf文件]
这似乎工作正常。
cuts<-cut2(v,g = 4,onlycuts = TRUE)
cuts[1]<- -Inf
cuts[length(cuts)]<- Inf
cuts
> cuts
[1] -Inf 4 7 10 Inf
table(cut2(v,cuts = cuts))
> table(cut2(v,cuts = cuts))
[-Inf, 4) [ 4, 7) [ 7, 10) [ 10, Inf]
3 3 3 3
但不是这个。如何根据用户定义的规则完成分箱?
cuts<-cut2(v,g = 7,onlycuts = TRUE)
cuts[1]<- -Inf
cuts[length(cuts)]<- Inf
cuts
> cuts
[1] -Inf 3 5 7 8 10 Inf
table(cut2(v,cuts = cuts))
> table(cut2(v,cuts = cuts))
[-Inf, 3) [ 3, 5) [ 5, 7) 7 [ 8, 10) [ 10, Inf]
2 2 2 1 2 3