Python的predict_proba

时间:2018-11-14 11:46:34

标签: python-3.x machine-learning scikit-learn

我对使用scikit learning中的log_loss函数的机器学习中的分类问题有疑问。

ID | NetAmount | PaymentAmount
1    2.99        1.99
2    2.99        2.99

我将计算对数损失,但出现错误:

from sklearn.ensemble import RandomForestClassifier
classifier = RandomForestClassifier()
classifier.fit(Xtrain, ytrain)
soft = classifier.predict_proba(Xtest)[:,1]
log_loss = log_loss(ytest, soft)

我认为这个问题可能是由于向量soft中有一些0造成的。但是我知道解决这个问题吗?

'numpy.float64' object is not callable

预先感谢

1 个答案:

答案 0 :(得分:-1)

似乎您的问题实际上与log_loss输入无关,而仅与变量命名有关。 Everything in python is an object,以此类推:

log_loss = log_loss(ytest, soft)

您为令牌numpy.float64分配了答案(一个数字(类型为log_loss)。因此,您的变量遮盖了该函数。然后,后续调用(好像它是一个函数)失败。

from sklearn.metrics import log_loss
print(log_loss)
>>> <function log_loss at 0x7f9f692db1b8>

log_loss = log_loss(ytest, soft)
print(log_loss)
>>> 0.11895972559889094
log_loss = log_loss(ytest, soft)
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-40-b423b2324b92> in <module>()
----> 1 log_loss = log_loss(ytest, soft)

TypeError: 'numpy.float64' object is not callable

最简单的解决方法是不调用变量log_loss,但更普遍的是,您可能会发现某种程度的命名空间帮助,例如代替

from sklearn.metrics import log_loss
...
loss = log_loss(ytest, soft)

您可以使用

from sklearn import metrics
...
loss = metrics.log_loss(ytest, soft)