我是机器学习和统计学的新手(好吧,我在大学里学习数学,但那是大约10 - 12年前) 能否请您从本书(https://www.researchgate.net/publication/227612766_An_Empirical_Comparison_of_Machine_Learning_Models_for_Time_Series_Forecasting)的4页(第5页)中解释以下句子的含义:
多层感知器(通常简称为神经网络)可能是最多的 今天使用的流行网络架构,用于分类和回归(Bishop [5])。 MLP如下: ñ H y = v0 + J = 1 X vj g(wj T x') (1) 其中x'是输入向量x,用1增加,即x'=(1,xT)T ,wj是权重 第j个隐藏节点的向量,v0,v1 ,. 。 。 ,vN H是输出节点的权重,y是 网络输出。函数g表示隐藏节点输出,并给出它 就压缩功能而言,例如(这就是我们使用的)物流 函数:g(u)= 1 /(1 + exp(-u))。计量经济学文献中的相关模型是
例如,我们有一个向量x = [0.2,0.3,0.4,0.5] 如何将其转换为将x'向量扩展为1 x'=(1,x)
答案 0 :(得分:1)
这是矩阵和方程组之间同构的一部分。你现在所拥有的是一个等同于右手边表达式的行,例如
w1 = 0.2*x1 + 0.3*x2 + 0.4*x3 + 0.5*x4
w2 = ...
w3 = ...
w4 = ...
当我们想要解决系统时,我们需要增加矩阵。这需要添加每个 w [n] 变量的系数。他们很简单:
1*w1 = 0.2*x1 + 0.3*x2 + 0.4*x3 + 0.5*x4
1*w2 = ...
1*w3 = ...
1*w4 = ...
......以及我们获得增强矩阵的地方。当我们假设变量按位置 - w按行,x按列 - 剩下的就是单独的系数,在一个漂亮的矩阵中。