在我的问题中,我有一个包含n
元素的向量。给定窗口大小k
我想有效地创建包含带状对角线的矩阵大小n x 2k+1
。例如:
a = [a_1, a_2, a_3, a_4]
k = 1
b = [[0, a_1, a_2],
[a_1, a_2, a_3],
[a_2, a_3, a_4],
[a_3, a_4, a_5],
[a_4, a_5, 0]]
实现这一点的天真方法是使用for循环
out_data = mx.ndarray.zeros((n, 2k+1))
for i in range(0, n):
for j in range(0, 2k+1):
index = i - k + j
if not (index < 0 or index >= seq_len):
out_data[i][j] = in_data[index]
这很慢。
只需使用tile
和reshape
即可轻松创建完整矩阵,但屏蔽部分并不清晰。
更新 我找到了一个更快但仍然很慢的实现:
window = 2*self.windowSize + 1
in_data_reshaped = in_data.reshape((batch_size, seq_len))
out_data = mx.ndarray.zeros((seq_len * window))
for i in range(0, seq_len):
copy_from_start = max(i - self.windowSize, 0)
copy_from_end = min(seq_len -1, i+1+self.windowSize)
copy_length = copy_from_end - copy_from_start
copy_to_start = i*window + (2*self.windowSize + 1 - copy_length)
copy_to_end = copy_to_start + copy_length
out_data[copy_to_start:copy_to_end] = in_data_reshaped[copy_from_start:copy_from_end]
out_data = out_data.reshape((seq_len, window))
答案 0 :(得分:2)
如果在您的操作中,k
和n
是不变的,您可以使用mxnet.nd.gather_nd()
和mx.nd.scatter_nd
的组合来执行您想要的操作。即使生成索引张量也同样效率低,因为您只需要执行一次,这不会有问题。您可能希望使用gather_nd
从原始数组中有效地“复制”数据,然后使用scatter_nd
将它们分散到最终的矩阵形状。或者,您可以简单地将0
元素连接到输入数组(例如[a_1, a_2, a_3]
将转换为[0, a_1, a_2, a_3]
),然后仅使用mxnet.nd.gather_nd()
将元素复制到最终矩阵中