在有条件的情况下在keras中实现自定义损失功能

时间:2018-06-29 11:15:45

标签: python tensorflow keras loss-function

我需要一些有关角膜脱落功能的帮助。我一直在使用Tensorflow后端在keras上实现自定义损失功能。

我已经在numpy中实现了自定义损失函数,但是如果可以将其转换为keras损失函数,那就太好了。损失函数采用数据帧和一系列用户ID。如果user_id不同,则相同user_id的欧几里得距离为正和负。该函数返回数据帧的标量距离总和。

def custom_loss_numpy (encodings, user_id):
# user_id: a pandas series of users
# encodings: a pandas dataframe of encodings

    batch_dist = 0

    for i in range(len(user_id)):
         first_row = encodings.iloc[i,:].values
         first_user = user_id[i]

         for j in range(i+1, len(user_id)):
              second_user = user_id[j]
              second_row = encodings.iloc[j,:].values

        # compute distance: if the users are same then Euclidean distance is positive otherwise negative.
            if first_user == second_user:
                tmp_dist = np.linalg.norm(first_row - second_row)
            else:
                tmp_dist = -np.linalg.norm(first_row - second_row)

            batch_dist += tmp_dist

    return batch_dist

我试图实现成角膜功能丧失功能。我从y_true和y_pred张量对象中提取了numpy数组。

def custom_loss_keras(y_true, y_pred):
    # session of my program
    sess = tf_session.TF_Session().get()

    with sess.as_default():
        array_pred = y_pred.eval()
        print(array_pred)

但是出现以下错误。

tensorflow.python.framework.errors_impl.InvalidArgumentError: You must feed a value for placeholder tensor 'dense_1_input' with dtype float and shape [?,102]
 [[Node: dense_1_input = Placeholder[dtype=DT_FLOAT, shape=[?,102], _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:7)

首先,在Keras损失函数中不可能“从y_truey_pred中提取numpy数组”。您必须使用Keras后端函数(或TF函数)来操作张量以计算损耗。

换句话说,最好考虑一种“向量化”的方法来计算损失,而不使用if-else和loops。

可以通过以下步骤计算损失函数:

  1. encodings中所有向量对之间生成成对的欧几里得距离矩阵。
  2. 生成一个矩阵I,如果I_ij的元素user_i == user_j为1,如果user_i != user_j则为-1。
  3. 将两个矩阵逐个元素相乘,并对元素求和以获得最终损失。

这是一个实现:

def custom_loss_keras(user_id, encodings):
    # calculate pairwise Euclidean distance matrix
    pairwise_diff = K.expand_dims(encodings, 0) - K.expand_dims(encodings, 1)
    pairwise_squared_distance = K.sum(K.square(pairwise_diff), axis=-1)

    # add a small number before taking K.sqrt for numerical safety
    # (K.sqrt(0) sometimes becomes nan)
    pairwise_distance = K.sqrt(pairwise_squared_distance + K.epsilon())

    # this will be a pairwise matrix of True and False, with shape (batch_size, batch_size)
    pairwise_equal = K.equal(K.expand_dims(user_id, 0), K.expand_dims(user_id, 1))

    # convert True and False to 1 and -1
    pos_neg = K.cast(pairwise_equal, K.floatx()) * 2 - 1

    # divide by 2 to match the output of `custom_loss_numpy`, but it's not really necessary
    return K.sum(pairwise_distance * pos_neg, axis=-1) / 2

在上面的代码中,我假设user_id是整数。这里的技巧是使用K.expand_dims来实现成对操作。乍一看可能有点困难,但这很有用。

它的损耗值应与custom_loss_numpy相同(由于K.epsilon()会有一点差异):

encodings = np.random.rand(32, 10)
user_id = np.random.randint(10, size=32)

print(K.eval(custom_loss_keras(K.variable(user_id), K.variable(encodings))).sum())
-478.4245

print(custom_loss_numpy(pd.DataFrame(encodings), pd.Series(user_id)))
-478.42953553795815

我在损失函数上犯了一个错误。

在训练中使用此功能时,由于Keras自动将y_true更改为至少2D,因此自变量user_id不再是1D张量。其形状将为(batch_size, 1)

要使用此功能,必须移除多余的轴:

def custom_loss_keras(user_id, encodings):
    pairwise_diff = K.expand_dims(encodings, 0) - K.expand_dims(encodings, 1)
    pairwise_squared_distance = K.sum(K.square(pairwise_diff), axis=-1)
    pairwise_distance = K.sqrt(pairwise_squared_distance + K.epsilon())

    user_id = K.squeeze(user_id, axis=1)  # remove the axis added by Keras
    pairwise_equal = K.equal(K.expand_dims(user_id, 0), K.expand_dims(user_id, 1))

    pos_neg = K.cast(pairwise_equal, K.floatx()) * 2 - 1
    return K.sum(pairwise_distance * pos_neg, axis=-1) / 2

答案 1 :(得分:4)

在Keras中实现参数化的自定义损失函数有两个步骤。首先,编写系数/度量的方法。其次,编写包装函数以格式化Keras需要的格式。

  1. 使用Keras后端代替tensorflow直接运行简单的自定义损失函数(如DICE)实际上要干净得多。这是通过这种方式实现的系数的示例:

    import keras.backend as K
    def dice_coef(y_true, y_pred, smooth, thresh):
        y_pred = y_pred > thresh
        y_true_f = K.flatten(y_true)
        y_pred_f = K.flatten(y_pred)
        intersection = K.sum(y_true_f * y_pred_f)
        return (2. * intersection + smooth) / (K.sum(y_true_f) + K.sum(y_pred_f) + smooth)
    
  1. 现在是棘手的部分。 Keras损失函数只能将(y_true, y_pred)作为参数。因此,我们需要一个单独的函数来返回另一个函数:

    def dice_loss(smooth, thresh):
        def dice(y_true, y_pred)
            return -dice_coef(y_true, y_pred, smooth, thresh)
        return dice
    

最后,您可以在Keras compile中如下使用它:

# build model 
model = my_model()
# get the loss function
model_dice = dice_loss(smooth=1e-5, thresh=0.5)
# compile model
model.compile(loss=model_dice)