神经网络分类数据实现

时间:2014-03-22 17:06:18

标签: neural-network

我一直在学习使用神经网络作为业余爱好项目,但是如何处理分类数据完全失败了。我阅读了文章http://visualstudiomagazine.com/articles/2013/07/01/neural-network-data-normalization-and-encoding.aspx,它解释了输入数据的规范化,并解释了如何使用效果编码预处理分类数据。我理解将类别分解为向量的概念,但不知道如何实际实现它。

例如,如果我使用国家/地区作为分类数据(例如芬兰,泰国等),我是否会将生成的矢量处理为单个数字以输入单个输入,或者我是否会单独输入向量的每个组成部分的输入?在后者的情况下,如果有196个不同的国家,这意味着我只需要196个不同的输入来处理这个特定的数据。如果向网络提供了大量不同的分类数据,我可以看到它变得非常笨拙。

我有什么遗失的东西吗?分类数据究竟是如何映射到神经元输入的?

1 个答案:

答案 0 :(得分:26)

神经网络输入

根据经验:不同的类和类别应该有自己的输入信号。

<小时/>

为什么不能用单个输入

对其进行编码

由于神经网络通过激活函数对输入值起作用,因此较高的输入值将导致较高的激活输入。

  

较高的输入值会使神经元更容易被射击。

只要您不想告诉网络ThailandFinland“更好”,那么您可以将国家/地区输入信号编码为{{ 1}}。

How not to format the input

<小时/>

应如何编码

每个国家都应该拥有自己的输入信号,以便它们能够同样激活神经元。 enter image description here