前一段时间,我试图获取一个小项目的错误分类实例。 现在我意识到其中有些显示为不正确,但实际上它们是正确的。
返回当我实现它时,我使用了这里发布的解决方案: Solution for showing incorrect classified instances
在我的情况下,代码如下:
indices = np.arange(y.shape[0])
i = 0
dfwrongclassified=pd.DataFrame()
for input, prediction, label in zip(indices[idx_train], rf_predictions, y_test):
if prediction != label:
i += 1
# print("vorhergehender Datensatz: ")
# print(df.iloc[input - 1].tolist())
print(input, 'has been classified as ', prediction, 'and should be ', label)
dfwrongclassified[input] = df.iloc[input].tolist()
# print(type(dfwrongclassified))
print(df.iloc[input].tolist())
print(dfwrongclassified.T)
print("----------------------------------------")
print("----------------------------------------")
我只是想不通,原因是什么,为什么实例被正确分类,但又显示为错误分类。
输出如下:
453 has been classified as 1 and should be 0
[..., 140909, 144417, 190205, 197952, 243641, 244495, 152995, 153307, 157026, 1]
由于1之前的最后一个数字大于120000,因此应将其分类为“ 1”。是的,但是这里仍然显示为错误分类。
所有这些数据背后的数据非常简单,并且可以正确地归为1或0。(最后一个数字> 120000-> 1否则为0)
如果您能帮助我找到我的错误,我将非常高兴。
欢呼