是否可以像在网格搜索中选择超参数一样,在候选对象中选择最佳sample_weight
值?
某些训练数据的权重可能会有所不同(例如,基于组成员资格,其中一些训练数据会更受信任),并且理想情况下,可以在网格搜索中找到多个可能权重的选择。将对不同的sample_weight
值进行测试,以查看该模型如何针对可最大程度信任结果的黄金标准保持测试集进行测试。
可以使用带有scoring
函数(GridSearchCV)的make_scorer
参数在RandomizedSearchCV或example中利用训练权重。但是,尚不清楚如何在几个候选对象中选择最佳的sample_weight
向量作为sklearn流水线的一部分。这可能吗?