问题:
对于几乎所有测试用例,输出概率接近0.95 ..没有输出低于0.9!
即使是几乎不可能的结果,它也给出了很高的概率。
有任何建议如何解决这个问题?或者可能是使用NN或实现prob函数的另一种方式?
由于
答案 0 :(得分:2)
问题在于所有可能的后续状态的总和必须等于1.如果您构建这样的网络,则无法保证。我想到了两种可能的选择,我假设离散状态。
从数学角度来看,这两个实际上大致相当。
在连续变量的情况下,您必须假设分布(例如,多元高斯分布)并使用该分布的参数(例如,均值和协方差stdev)作为输出。
答案 1 :(得分:0)
在拟合NN时,您可能希望拟合更广泛的数据,在训练中是否有任何数据要符合0概率?如果没有,我怀疑你可能会得到不好的结果。作为第一步,我会尝试在训练数据集中选择一些不同的东西。
另外你是如何训练NN的?你尝试过使用其他方法吗?如何激活功能,也许尝试使用一些不同的功能。
使用神经网络,我认为在选择模型时会有一些试验和错误会有所帮助。 (对不起,如果这一切都不够具体。)