Question

我正在处理序列数据（一个热编码序列），并且正在寻找一种方法来编写自定义损失函数，该函数使用基于y_pred和y_true的值字典中的权重，并取决于这些值训练时（因此，我不能在健身时使用恒定重量）。

基本上，对于序列矩阵中每个argmax索引位置，我都可以检索一个字符。对于每两个字符，我可以获取一个权重。这些字典如下：

values = 
     {0: 'A',
      1: 'C',
      2: 'D',
      ...}
matrix = array
     ([[ 4, -1, -2, -2,  0, -1, -1,  0, -2, -1, -1, -1, -1, -2, -1,  1,
         0, -3, -2,  0, -2, -1,  0, -4],
       [-1,  5,  0, -2, -3,  1,  0, -2,  0, -3, -2,  2, -1, -3, -2, -1,
        -1, -3, -2, -3, -1,  0, -1, -4],
       [-2,  0,  6,  1, -3,  0,  0,  0,  1, -3, -3,  0, -2, -3, -2,  1,
         0, -4, -2, -3,  3,  0, -1, -4],
       ...]])

我想做这样的事情：

y_true (n,155,20) ---K.argmax(.., axis=2)---> a:(n,155)

y_pred (n,155,20) ---K.argmax(.., axis=2)---> b:(n,155)

for i in range(n):
   for j in range(155):
      weights[i,j] = matrix[values[a[i,j]], values[b[i,j]]]

想象一下，有一种方法可以通过其他命令获得上述矩阵值。

然后我要像这样使用我的weights矩阵：

def custom_loss_mse(y_true,y_pred):
    w = getWeights(y_true,y_pred)
    return K.mean(K.dot(w, K.square(y_pred-y_true)), axis=-1)

到目前为止，我只发现this question有帮助，但并不是很相似。

这很容易，但是由于计算图模型的原因，keras使我更难做。应该有一些快速的方法来做到这一点，但是我没有想法。

由于我对numpy和keras相当陌生，所以我将不胜感激。

Answer 1

您可以使用tf.gather来获取特定索引处的张量值。例如，您可以使用以下代码构造a：

index = K.argmax(y_true, axis=2)
a = tf.diag_part(tf.gather(y_true, index, axis=2))  # shape (n, 155)

我认为不可能从字典中获取值，因为所有计算都必须是符号性的。但是，如果可以使用矩阵而不是字典，则可以使用K.constant将矩阵转换为张量，然后可以使用与上述相同的方法来获取特定索引处的值，具体取决于输入张量。

keras中的加权MSE自定义损失函数-自定义权重

1 个答案: