我想使用在Apache Solr中经过XGBoost *训练的成对排名模型。我猜XGBoost模型应该由Solr LTR插件中的MultipleAdditiveTreesModel类处理。
但是,当将XGBoost输出映射到Solr LTR插件期望的JSON时,尚不清楚如何处理 missing 条件。由于XGBoost具有非平凡的逻辑来路由缺失值,因此它们不能总是发送到树的 left 或 right 分支。
该问题应如何处理? XGBoost中是否有一个选项可以强制将丢失的值始终路由到同一分支或更好的分支,Solr LTR插件中是否有一个选项可以处理丢失的值的情况?
*目标:“ rank:pairwise”
答案 0 :(得分:0)
作为一种解决方法,可以从训练数据中删除所有丢失的数据,并且在为Solr转换模型时仅忽略“丢失”条件。但是,这样做的缺点是浪费计算和内存资源,并可能浪费XGBoosts的性能。