神经网络:处理不可用的输入(丢失或不完整的数据)

时间:2010-04-08 23:36:49

标签: machine-learning neural-network

希望本周末你能从我这里得到最后一个NN问题,但是这里有:)

有没有办法处理你“并不总是知道”的输入...所以它不会以某种方式影响权重?

Soo ......如果我问某人他们是男性还是女性并且他们不想回答,有没有办法忽视这些意见?也许把它直接放在中心? (假设1,0输入为0.5?)

由于

2 个答案:

答案 0 :(得分:8)

您可能知道这一点或怀疑它,但是通过对可能值的范围进行平均来猜测或提供缺失值没有统计依据等。

特别是对于NN,有很多技术可供选择。我使用的技术 - 我编码 - 是一种更简单的技术,但它有一个坚实的统计基础,现在仍然使用。描述它的学术论文here

这种技术的基础理论是对整数数据的加权整合。在实践中,没有评估积分,而是通过高斯基函数网络的闭合解来近似它们。正如您将在论文中看到的那样(这是一个逐步的解释,在您的backprop算法中实现起来很简单。

答案 1 :(得分:4)

神经网络对噪音具有相当的抵抗力 - 这是它们的一大优势。您可能希望尝试将输入置于(-1.0,1.0),而将0作为非输入输入。这样,来自该神经元的权重输入为0.0,意味着不会在那里学习。

Simon S. Haykin的神经网络和学习机神奇网络和学习机可能是我曾经遇到过不幸的最好的书。在其中,他讨论了各种各样的问题,包括你应该如何分配你的输入/训练集以获得最佳训练等。这是一本非常好的书!