当我的CNN多类网络在不属于图片的情况下输出类似[0.1, 0,1]
的内容时应该采取什么方法
任何班级对多个类使用softmax和categorical_crossentropy会给我输出总计为1的输出,所以仍然不是我想要的。
我是神经网络的新手,很抱歉提出这个愚蠢的问题,并在此先感谢您的帮助。
答案 0 :(得分:0)
我认为您会考虑贝叶斯学习。首先,谈论不确定性。
例如,给定几张狗品种的图片作为训练数据(当用户上传他的狗的图片时),假设的网站应以很高的置信度返回预测。但是,如果用户上传猫的照片并要求网站确定狗的品种,应该怎么办?
以上是分发测试数据的示例。该模型已在不同品种的狗的照片上经过训练,并且(希望)学会了很好地区分它们。但是该模型以前从未见过猫,因此在训练模型的数据分布范围之外还可以看到猫的照片。这个说明性示例可以扩展到更严格的设置,例如具有诊断系统从未见过的结构的MRI扫描,或者从未培训过自动驾驶转向系统的场景。
在这种情况下,模型的可能期望行为将是返回预测(试图推断远离我们观察到的数据的距离),但是返回带有点信息位于数据分布之外的附加信息的答案。我们希望我们的模型具有一定数量的数量,这些数量可以通过这种输入传达高水平的不确定性(或者,传达低可信度)。
然后,当它们也适用于分类任务并为类(狗,猫...)产生不确定性时,我想您可以简要阅读this paper。从本文可以将您的发现扩展到使用本文的应用程序,我想您会找到想要的。