Andrew NG的机器学习课程课程使用每个神经网络的二进制输入和标量输出,例如:[101011] - > [2]
为什么二进制数字用于训练数据而不是标量?是否与每个层的Theta值最初在0和1之间随机化的事实有关?
答案 0 :(得分:0)
我无法记住背景,但我曾经被告知这个问题的答案。
基本上,通过这种方式训练网络更容易,而不是使用标量。每个位都有自己的语义含义,因此每个位都应该有自己的专用神经元。我知道数据表示总是与神经网络混乱!
关于Theta,答案是否定的。如你所说,theta最初是从[0; 1]采样的,但是在经过几轮算法后它会变大(或变为负数)。这是常见的行为。