我试着在我的数据上第一次使用gbm(实际上是第一次使用任何类型的回归树),其中包含14个连续因变量和一个13个级别的响应变量因子。我通过Elith等人的非常好的描述来到gbm,然而他使用了无法处理多项分布的基本gbm包的修改。 gbm的帮助声称它可以解决这个问题:
“distribution:指定要使用的分发名称的字符串或列表 使用指定分布的组件名称以及所需的任何其他参数。如果没有指定,gbm将尝试猜测:如果响应只有 假设bernoulli有2个独特的值;否则,如果响应是一个因素, 假设多项式;否则,如果响应有“Surv”类,则coxph为 假定;否则,假设高斯。 目前可用的选项是“高斯”(平方误差),“拉普拉斯”(绝对值) 损失),“tdist”(t-分布损失),“bernoulli”(0-1结果的逻辑回归),“中心化”(0-1结果的中心化铰链损失),“多项式” (当有超过2个班级时分类),“adaboost”(AdaBoost 0-1结果的指数损失),“泊松”(计数结果),“coxph”(右 审查观察),“分位数”或“成对”(使用 LambdaMart算法)。“
然而,无论我是指定“多项”还是“让它猜测”,它都不起作用。任何人都知道我做错了什么?或者我完全误解了一些东西 - 我的数据的多项分布不是意味着,我的错误丢失函数也是多项分布的吗?它运行,如果我选择“高斯”,但我想在那种情况下计算完全不同的东西? 我很感激任何帮助! 艾格尼丝
答案 0 :(得分:0)
您使用的是最新版本的gbm吗?我有一个类似的问题,在重新安装gbm软件包后解决了。