我有一个大型数据集,有10个不同的输入和1个输出。所有输出和输入都是谨慎的(低,中,高)。我正在考虑为这个问题创建一个神经网络,但是当我设计网络有3个不同的输出(LOW,MEDIUM,HIGH)并使用softmax神经元时,我基本上得到了'概率'。我是对的吗?
这让我觉得尝试Naive Bayes分类器可能会更好,因而忽略输入变量之间可能的相关性,但是在大型数据集中Naive Bayes显示出有希望的结果。
在这种情况下,是否有理由选择神经网络而不是贝叶斯?当您想要概率作为输出时(在神经网络中使用softmax函数),选择神经网络的原因是什么。
答案 0 :(得分:5)
是的,通过输出层中的softmax激活,您可以将输出解释为概率。
在朴素贝叶斯上选择人工神经网络(ANN)的一个潜在原因是你提到的可能性:输入变量之间的相关性。 Naive Bayes假设所有输入变量都是独立的。如果该假设不正确,那么它会影响朴素贝叶斯分类器的准确性。具有适当网络结构的ANN可以处理输入变量之间的相关性/依赖性。