我目前正在研究计算机科学教科书中的一些概念。线性代数被大量使用,它们在教科书中展示的例子都使用了Numpy。
特别是一个表达让我完全糊涂了,因为它似乎是一个完全没用的表达。从教科书中逐字复制,它说:
normalisers = sum(exp(outputs),axis=1)*ones((1,shape(outputs)[0]))
所以,为了简化起见,我会删除exp
(这与此处的问题无关),这给了我们:
sum(outputs,axis=1)*ones((1,shape(outputs)[0]))
其中outputs
是2-D Numpy array
(矩阵)。
据我所知,这只是对outputs
矩阵中的所有行进行求和,然后将得到的向量元素乘以所有1的向量。所以...这里所有人的成倍是什么意义?它根本不会改变这些值。
这是教科书中的一个错误,还是我只是没有看到所有这些错误会对这里的值产生什么影响呢?我现在对Numpy只有一点熟悉,所以我不确定我是否只是误解了这个表达的一些含义。
答案 0 :(得分:3)
正如mutzmatron在评论中写道,当outputs
是一个数组时,这种乘法是一种非常人为的方法,可以将sum
的结果形状从(n,)
更改为{{1 }}。快速而惯用的方法是
(1,n)
与教科书中的方式相比,这是可读和可扩展的,因为sum(exp(outputs), axis=1).reshape(1, -1)
需要不变而不是线性时间和内存。
但是,如果reshape
不是数组而是可怕类型outputs
的对象,则结果完全不同:
np.matrix
(但是,这仍然是表达不同操作的一种人为的方式。)