以下是我必须为Numpy矩阵的每个元素计算的公式:
Mi_j = Sum_v(Av * Xi_v) + Sum_v(Bv * Wj_v) + Sum_v(Gv * Zij_v)
我真的不知道如何以笨拙的方式编写代码(在python中它太长了):vectorized / slicing / C Api。
你会建议什么,你能给我一个简单的例子吗?我是numpy的新手。
@Edited indices
答案 0 :(得分:2)
我个人觉得它更具可读性,决定代数过程,然后使用numpy矩阵作为标准。如果你的工作完全是数学的,那么如果使用numpy matrix
类,将数学转换为代码会更容易,反之亦然。
这也可以帮助您避免必须小心广播。
从:
开始Mi_j = Sum_v(Av * Xi_v) + Sum_v(Bv * Wj_v) + Sum_v(Gv * Zij_v)
numpy成为:
M = X*A + (W*B).T + Z*G
如果将每个矩阵初始化为np.matrix
,则会自动完成正确的代数。
import numpy as np
N = 5
A = np.asmatrix(np.arange(N)).T
B = np.asmatrix(np.arange(N)).T
G = np.asmatrix(np.arange(N)).T
X = np.asmatrix(np.arange(N*N).reshape(N,N))
W = np.asmatrix(np.arange(N*N).reshape(N,N))
Z = np.asmatrix(np.arange(N**3).reshape(N,N,N))
请注意,我{1}}表示1d矩阵,因为默认情况下1d矩阵是行向量。真矢量是列矢量。之后,您不再需要担心广播。
transpose
答案 1 :(得分:1)
让我们通过一个简单的例子:
如果我们定义:
import numpy as np
N = 5
A = np.arange(N)
X = np.arange(N*N).reshape(N,N)
B = np.arange(N)
W = np.arange(N*N).reshape(N,N)
G = np.arange(N)
Zij = np.arange(N)
然后可以使用Sum_v(Av * Xi_v)
计算第一个总和np.dot
:
In [54]: X
Out[54]:
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19],
[20, 21, 22, 23, 24]])
In [55]: A
Out[55]: array([0, 1, 2, 3, 4])
In [56]: np.dot(X, A)
Out[56]: array([ 30, 80, 130, 180, 230])
同样,第二个总和Sum_v(Bv * Wj_v)
可以计算为:
In [58]: np.dot(W,B)
Out[58]: array([ 30, 80, 130, 180, 230])
然而,我们希望第一个和产生一个沿i
- 索引变化的向量,而我们希望第二个和产生一个沿着j
- 索引变化的向量。要安排在numpy,使用广播:
In [59]: np.dot(X,A) + np.dot(W,B)[:,None]
Out[59]:
array([[ 60, 110, 160, 210, 260],
[110, 160, 210, 260, 310],
[160, 210, 260, 310, 360],
[210, 260, 310, 360, 410],
[260, 310, 360, 410, 460]])
第三个和是两个一维数组之间的简单点积:
In [60]: np.dot(Zij, G)
Out[60]: 30
所以把它们放在一起,
In [61]: M = np.dot(X,A) + np.dot(W,B)[:,None] + np.dot(Zij, G)
In [62]: M
Out[62]:
array([[ 90, 140, 190, 240, 290],
[140, 190, 240, 290, 340],
[190, 240, 290, 340, 390],
[240, 290, 340, 390, 440],
[290, 340, 390, 440, 490]])
注意我可能误解了Zij
的含义。虽然你说它是一维数组,但也许你的意思是为每个 i,j
它是一维数组。然后Z
将是3维的。
为了具体起见,我们假设Z
的前两个轴代表i
和j
- 索引,Z
的最后一个轴是{你希望总结一下。
在这种情况下,您希望最后一个字词为np.dot(Z, G)
:
In [13]: Z = np.arange(N**3).reshape(N,N,-1)
In [14]: np.dot(X,A) + np.dot(W,B)[:,None] + np.dot(Z, G)
Out[14]:
array([[ 90, 190, 290, 390, 490],
[ 390, 490, 590, 690, 790],
[ 690, 790, 890, 990, 1090],
[ 990, 1090, 1190, 1290, 1390],
[1290, 1390, 1490, 1590, 1690]])