我有一个二维张量,我想从每一行中提取少量起始元素。
我具有(必须针对每行)列索引,必须捕获到的元素。
请注意,不同行的列索引是不同的。
以下示例使它得以创建:
2d张量是:
[[4 2 4 4 1 1 1 1 1 1 1 1 1 1 1 1]
[4 4 4 4 4 4 4 1 1 1 1 1 1 1 1 1]
[4 4 4 5 4 4 4 1 1 1 1 1 1 1 1 1]
[4 4 1 4 4 4 4 1 1 1 1 1 1 1 1 1]
[4 4 4 4 6 4 4 8 8 1 1 1 1 1 1 1]
[3 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]
[3 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]
[1 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]
[3 9 4 9 9 9 9 1 1 1 1 1 1 1 1 1]
[3 9 9 6 9 9 9 1 1 1 1 1 1 1 1 1]]
,索引数组为:
[4 7 7 7 9 7 7 7 7 7]
如何从上面的索引数组中获取以下数组:
[[4 2 4 4 ]
[4 4 4 4 4 4 4 ]
[4 4 4 5 4 4 4]
[4 4 1 4 4 4 4]
[4 4 4 4 6 4 4 8 8]
[3 9 9 9 9 9 9 ]
[3 9 9 9 9 9 9 ]
[1 9 9 9 9 9 9 ]
[3 9 4 9 9 9 9 ]
[3 9 9 6 9 9 9 ]]
答案 0 :(得分:1)
这里是将其作为稀疏张量的一种方法:
import tensorflow as tf
# Example data
data = [[4, 2, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[4, 4, 4, 4, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[4, 4, 4, 5, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[4, 4, 1, 4, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[4, 4, 4, 4, 6, 4, 4, 8, 8, 1, 1, 1, 1, 1, 1, 1],
[3, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[3, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[1, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[3, 9, 4, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
[3, 9, 9, 6, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1]]
sizes = [4, 7, 7, 7, 9, 7, 7, 7, 7, 7]
with tf.Graph().as_default():
# Input data
data_ph = tf.placeholder(tf.int32, [None, None])
sizes_ph = tf.placeholder(tf.int32, [None])
shape = tf.shape(data_ph)
# Make coordinates grid
ii, jj = tf.meshgrid(tf.range(shape[0]), tf.range(shape[1]), indexing='ij')
# Make mask for values
mask = jj < tf.expand_dims(sizes_ph, 1)
# Take values and coordinates
sp_values = tf.boolean_mask(data_ph, mask)
sp_ii = tf.boolean_mask(ii, mask)
sp_jj = tf.boolean_mask(jj, mask)
# Make sparse index
sp_idx = tf.cast(tf.stack([sp_ii, sp_jj], axis=1), tf.int64)
# Make sparse tensor
sp_tensor = tf.sparse.SparseTensor(sp_idx, sp_values, tf.cast(shape, tf.int64))
# Convert back to dense for testing
sp_to_dense = tf.sparse.to_dense(sp_tensor)
# Test
with tf.Session() as sess:
sp_to_dense_value = sess.run(sp_to_dense, feed_dict={data_ph: data, sizes_ph: sizes})
print(sp_to_dense_value)
输出:
[[4 2 4 4 0 0 0 0 0 0 0 0 0 0 0 0]
[4 4 4 4 4 4 4 0 0 0 0 0 0 0 0 0]
[4 4 4 5 4 4 4 0 0 0 0 0 0 0 0 0]
[4 4 1 4 4 4 4 0 0 0 0 0 0 0 0 0]
[4 4 4 4 6 4 4 8 8 0 0 0 0 0 0 0]
[3 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
[3 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
[1 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
[3 9 4 9 9 9 9 0 0 0 0 0 0 0 0 0]
[3 9 9 6 9 9 9 0 0 0 0 0 0 0 0 0]]
这不是绝对理想的,因为它需要使用完整的坐标网格进行操作。在NumPy中,您可能首先可以生成索引,然后从密集的张量中仅选择所需的值,但是我不确定TensorFlow是否可以实现。