我正在编写一个函数,它使用kmeans来确定bin宽度,将连续测量(预测概率)转换为整数(3个bin中的一个)。我偶然发现了一个边缘情况,我的算法可以(正确地)预测整个集合的相同概率,我想处理这种情况。我通过以下方式使用rattle
包的binning()
函数:
btsKmeansBin <- function(x, k = 3, default = c(0, 0.3, 0.5, 1)) {
result <- binning(x, bins = k, method = "kmeans", ordered = T)
bins <- attr(result, "breaks")
attr(bins, "names") <- NULL
bins <- bins[order(bins)]
bins[1] <- 0
bins[length(bins)] <- 1
return(bins)
}
在x <- c(.5,.5,.5,.5,.5,.5)
上运行此功能,您将在order(bins)
步骤中收到错误,因为bins
将为NULL,因此不是矢量。
显然,如果x
只有一个不同的值,则kmeans不起作用。在这种情况下,我想返回default
bin分区。发生这种情况时,binning
发出“警告:不考虑变量”。所以我想使用tryCatch
来处理此警告,但使用以下代码围绕result <- ...
行并不像我期望的那样:
...
tryCatch({
result <- binning(x, bins = k, method = "kmeans", ordered = T)
}, warning = function(w) {
warn(sprintf("%s. Using default values", w))
return(default)
}, error = function(e) {
stop(e)
})
...
警告打印好像我没有使用tryCatch
,代码超过return
语句并再次从order
引发错误。我试过一堆变化无济于事。我错过了什么,这里?
答案 0 :(得分:8)
如果您查看binning
我认为您会发现&#34;警告&#34;您看到的内容不是通过warning()
生成的,而是cat()
生成的,这就是为什么tryCatch
无法提取它的原因。 binning
的作者可能因为这种疏忽而应该用湿面条绑一些鞭子。 ;)(或者它可能是故意的,因为拨浪鼓的特殊方式起作用,我不确定。)
当发生这种情况时,似乎会返回NULL
,因此您可以手动处理它。不理想,但可能是唯一的出路。