我有一个Python代码,使用XGBoost预测Pandas数据帧。这是我的代码。
feature_importance = model.predict(xgb.DMatrix(df[[i for i in
cols]],df['res'],missing=np.nan),**pred_contribs=True**)
我正在尝试使用XGBoost 4j- Spark库在Spark中重写它
但是我无法在转换或预测方法中找到pred_contribs
标志。我也无法在XGBoost的Spark Wrapper中找到单独的方法-XGBRegressor / XGBClassifier。
我只想运行预测方法,但要以分布式方式运行。 有人可以帮我吗?
我能够在Booster类中找到该方法,但是不知道如何在spark数据帧上使用该方法,因为它期望DMatrix,并且我不想在一台机器上创建DMatrix。