我正在理解Mxnet框架。在关注此Linear Regression article后,我看到以下创建密集层的代码:
net = gluon.nn.Dense(1, in_units=2) # input dimension= 2, output dimension = 1
但为什么print(net.weight)
会形成Parameter dense4_weight (shape=(1, 2), dtype=None)
形状不应该是(2, 1)
吗?
根据我的理解:
input = Shape(n, 2) where n is number of samples
output = Shape(n, 1)
所以权重矩阵应该是Shape(2,1)用于矩阵乘法,不是吗?
我在这里缺少什么?
答案 0 :(得分:1)
这仅仅是由于内部实施。您可以将其视为权重矩阵在乘法之前被转置。