应用错误收集

考虑轻量GBM中的样本重量

时间：2018-01-05 10:07:33

标签： python machine-learning lightgbm

我们用于建模的样本集是从一个大的整个数据集中采样的。通常当我们对记分卡模型使用逻辑回归时，我们会考虑样本集和整个数据集之间的好样本与坏样本的比率变化为 factor 或重量。

如果我们考虑将模型应用于整个数据集，我认为当我们使用lightGBM时，该因素将影响树的分割。就像我们有一个名为＆＃34; age＆＃34;的功能。如果我们不考虑权重，它应该拆分为32，但权重告诉整个数据集或人口，更多样本低于25，分割应该是28。

我在lightGBM中找到了两种可能的方法：将 is_unbalance 设置为False并将 scale_pos_weight 设置为 weight ，或设置 is_unbalance < / em>为True并将 weight 作为数组传递给参数＆＃34; sample_weight＆＃34;在适应功能。

我不知道哪一个是有效的，可以达到我们的目标，即在lightGBM中考虑样品重量

0 个答案:

没有答案

相关问题

考虑负载/重量的概率资源选择

考虑密度的重量与体积转换。怎么样？

考虑轻量GBM中的样本重量

LightGBMError：b＆＃39;标签必须在[0,3]中，但在标签中找到-2147483648＆＃39;

在多标签分类中使用样品重量

什么是sklearn.model_selection.train_test_split中的样本权重

二进制：逻辑类似于LightGBM中的参数

在Tensorflow数据集管道中计算样本权重

R：我可以将权重参数传递到LightGBM中的params = list（）中吗

keras：样本权重多重不平衡输出

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？