可以进行矢量化计算,其中一个向量中的每一列都被视为标量吗?
假设您有两个numpy数组:
a = np.array([(True, False),
(True, True),
(False, True),
(True, False),
(True, True),
(False, True),
(True, True)
])
b = np.array([[1, 3, 8, 3, 8, 3, 8],
[4, 8, 6, 8, 6, 8, 6],
[5, 9, 4, 9, 4, 9, 4],
[6, 2, 3, 2, 3, 2, 3],
[7, 4, 1, 4, 1, 4, 1],
[8, 9, 9, 9, 9, 9, 9],
[9, 1, 1, 1, 1, 1, 1]])
并希望将a
的每一列乘以整个向量b
,sum
并将其作为a
(或dataframe
)返回。这可以做矢量化(没有for循环)吗?
df = pd.DataFrame(np.zeros_like(a))
for column in range(a.shape[1]):
scalar_of_a = a[:, column][:, None]
vector_of_a_b = scalar_of_a*b
df.loc[:, column] = vector_of_a_b.sum(axis=0)[:, None]
答案 0 :(得分:2)
使用matrix-multiplication
-
df = pd.DataFrame(b.T.dot(a)) # or pd.DataFrame(a.T.dot(b).T)
使用np.einsum
-
df = pd.DataFrame(np.einsum('ij,il->lj',a,b))