对实际价值的张量进行桶化

时间:2019-06-21 20:23:16

标签: python tensorflow mapping slice

我有一个像这样的矩阵:

tf_ent = tf.Variable([   [9.96,    8.65,    0.8,    0.1 ],
                         [0.7,     8.33,    0  ,    0   ],
                         [0.9,     0,       6,      7.33],
                         [6.60,    0,       3,      5.5 ],
                         [9.49,    0.,      0,      0   ],
                         [0.4,     8.45,    0,      0.2 ],
                         [0.3,     0,       5.82,   8.28]])

我想得到一个输出,其中相同范围内的权重得到相同的number

换句话说,该数字很好地代表了矩阵中的weight range

所以我的理想输出可能是这样的:

                [[5,    5,    1,    1],
                 [1,    5,    0,    0],
                 [1,    0,    6,    5],
                 [4,    0,    2,    3],
                 [5,    0.,   0,    0],
                 [1,    5,    0,    1],
                 [1,    0,    3,    5]]

在这种情况下,我是在这种情况下映射的(考虑到我已经映射了):

range(0.1, 1) -> 1
range( 1, 3) -> 2
range( 3, 5) -> 3
range(5, 7) -> 4
range (7, 10) -> 5

首先,我尝试使用tf.histogram_fixed_width_bins,但它没有给我预期的结果: 这是我的代码:

value_ranges = [0, 10.0]
nbins = 5
new_f_w_t = tf.histogram_fixed_width_bins(tf_ent, value_ranges, nbins)
print(new_f_w_t)

这是此代码的输出:

output= [[4 4 0 0]
        [0 4 0 0]
        [0 0 3 3]
        [3 0 1 2]
        [4 0 0 0]
        [0 4 0 0]
        [0 0 2 4]]

输出更像是获得那些浮点数的等效整数,而不是考虑任何范围。

如何有效地获得矩阵的动态映射?

提前感谢:)

2 个答案:

答案 0 :(得分:1)

这等效于np.digitize操作。您可以使用math_ops._bucketize

from tensorflow.python.ops import math_ops

bins = [0.1, 1, 3, 5, 7, 10]
new_f_w_t = math_ops._bucketize(tf_ent, boundaries=bins)

new_f_w_t.numpy()
array([[5, 5, 1, 1],
       [1, 5, 0, 0],
       [1, 0, 4, 5],
       [4, 0, 3, 4],
       [5, 0, 0, 0],
       [1, 5, 0, 1],
       [1, 0, 4, 5]], dtype=int32)

答案 1 :(得分:0)

tf.searchsorted()调用也可以用于此目的,从而避免调用隐藏的_bucketize函数。不过,您必须平铺垃圾箱以匹配输入值的尺寸。

例如:

bins = tf.tile([[0.1, 1, 3, 5, 7, 10]], (tf_ent.shape[0], 1))
new_f_w_t = tf.searchsorted(bins, tf_ent, side="right")