有人可以帮助我获取预期概率值的代码吗?我的模型工作正常,并且给我的预测为1和0,但是我也需要概率值。该代码在两个python文件中。第一个文件使用训练数据集来创建地图文件。第二个python文件(评分文件)使用测试数据上的地图文件进行预测。有人可以让我知道我应该插入以获得概率值的代码。 下面的代码来自评分文件,在这里我需要获取概率值的代码
pred = model.predict(X.values)
data["Predicted"] = pred
# I NEED THE CODE HERE TO GET THE PROBABILITY VALUES.
data.to_excel(r'result.xlsx', index=False)
非常感谢
答案 0 :(得分:2)
检查您的模型是否具有predict_proba
方法。
用法与相同的predict
方法相同。
prob = model.predict_proba(X.values)
编辑:
sklearn的一些学习模型实现提供了predict_proba
方法。这不是度量标准,而是我所说的学习模型类别的一种方法。
例如:
from sklearn.tree import DecisionTreeClassifier
# after split you have X_train,y_train,X_testy_test
model = DecisionTreeClassifier()
model.fit(X_train,y_train)
proba = model.predict_proba(X_test)
答案 1 :(得分:0)
我不再能够编辑我的问题,因此将其放在此处。
感谢所有帮助。我正在使用随机森林模型。这是我的代码,下面的第4行给出了错误。如果删除第4行,代码将运行,但是在最终的excel文件中,我没有得到概率,而只有预测值1和0。有人可以让我知道如何解决此错误。错误的最后一行说 ValueError:传递的项目数错误2,展示位置表示1
pred = model.predict(X.values)
data["Predicted"] = pred
prob = model.predict_proba(X.values)
data["Pred Value"]= prob - this line causes error
data.to_excel(r'result.xlsx', index=False)'
谢谢