如何在tensorflow中对一批2D张量进行排序?

时间:2017-10-04 18:45:52

标签: sorting multidimensional-array tensorflow

我的张量A的形状为[#batch, #MaxSequence, #Features],其中第二维的实际长度(可能小于#MaxSequence)存储在张量{{1}中}。我想按照每个批次中序列的第三维中的第二个特征对L进行排序。我看到这个post使用Atf.gather来对2D张量进行排序,但我不知道将其应用于3D案例。我是否需要使用循环来完成它?

1 个答案:

答案 0 :(得分:3)

我有一些工作但可能存在更好的解决方案。我想我的代码对于这个简单的问题可能过于复杂了。

我们的想法是,我们必须将tf.nn.top_k(a[:,:,1].indices的返回索引(第三维中的第二个特征的顺序)转换为tf.gather_nd可以使用的返回索引。特别是对于我下面的例子,我们需要转换张量

 [[3, 2, 1, 0],
  [0, 1, 2, 3],
  [2, 0, 3, 1]] 

 [[[0 3], [0 2], [0 1], [0 0]]
  [[1 0], [1 1], [1 2], [1 3]]
  [[2 2], [2 0], [2 3], [2 1]]]

我想出了什么:

  • 首先展平目标指数,因此我们得到[3 2 1 0 0 1 2 3 2 0 3 1]
  • 故意构建配对向量[0 0 0 0 1 1 1 1 2 2 2]
  • tf.stack以上两个向量,然后我们将结果重塑为期望的结果。

完整的tf代码如下(get_shape方法已定义here):

import tensorflow as tf
a = tf.Variable([[[0.51, 0.52, 0.53, 0.94, 0.35],
                  [0.32, 0.72, 0.83, 0.74, 0.55],
                  [0.23, 0.73, 0.63, 0.64, 0.35],
                  [0.01, 0.74, 0.73, 0.04, 0.75]],
                 [[0.32, 0.76, 0.83, 0.74, 0.55],
                  [0.23, 0.72, 0.63, 0.64, 0.35],
                  [0.11, 0.02, 0.03, 0.14, 0.15],
                  [0.01, 0.00, 0.73, 0.04, 0.75]],
                 [[0.51, 0.52, 0.53, 0.94, 0.35],
                  [0.32, 0.00, 0.83, 0.74, 0.55],
                  [0.23, 0.92, 0.63, 0.64, 0.35],
                  [0.11, 0.02, 0.03, 0.14, 0.15]]], tf.float32)
batch_size, seq_length, num_features = get_shape(a)

idx = tf.reshape(range(batch_size), [-1, 1])
idx_flat = tf.reshape(tf.tile(idx, [1, seq_length]), [-1])
top_k_flat = tf.reshape(tf.nn.top_k(a[:,:,1], 
                                    k=seq_length).indices, [-1])
final_idx = tf.reshape(tf.stack([idx_flat, top_k_flat], 1),
                       [batch_size, seq_length, 2])
reordered = tf.gather_nd(a, final_idx)
sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
print sess.run(reordered)

                 #ORDERED
                 #by this
                 #Column (within each example)
[[[ 0.01      ,  0.74000001,  0.73000002,  0.04      ,  0.75      ],
  [ 0.23      ,  0.73000002,  0.63      ,  0.63999999,  0.34999999],
  [ 0.31999999,  0.72000003,  0.82999998,  0.74000001,  0.55000001],
  [ 0.50999999,  0.51999998,  0.52999997,  0.94      ,  0.34999999]],
 [[ 0.31999999,  0.75999999,  0.82999998,  0.74000001,  0.55000001],
  [ 0.23      ,  0.72000003,  0.63      ,  0.63999999,  0.34999999],
  [ 0.11      ,  0.02      ,  0.03      ,  0.14      ,  0.15000001],
  [ 0.01      ,  0.        ,  0.73000002,  0.04      ,  0.75      ]],
 [[ 0.23      ,  0.92000002,  0.63      ,  0.63999999,  0.34999999],
  [ 0.50999999,  0.51999998,  0.52999997,  0.94      ,  0.34999999],
  [ 0.11      ,  0.02      ,  0.03      ,  0.14      ,  0.15000001],
  [ 0.31999999,  0.        ,  0.82999998,  0.74000001,  0.55000001]]

在输出中注意,我们有三个例子。在每个示例中,序列按第二特征递减排序。