我尝试学习如何在mxnet中使用自定义丢失功能。
Bellow是线性回归的最小(非)工作示例。 当我设置' use_custom = False'一切都很好,而不是习惯性的损失是不行的。我做错了什么?
import mxnet as mx
import logging
logging.basicConfig(level='DEBUG')
use_custom = False
mx.random.seed(1)
A = mx.nd.random.uniform(-1, 1, (5, 1))
B = mx.nd.random.uniform(-1, 1)
X = mx.nd.random.uniform(-1, 1, (100, 5))
y = mx.nd.dot(X, A) + B
iter = mx.io.NDArrayIter(data=X, label=y, data_name='data', label_name='label', batch_size=20, shuffle=True)
data = mx.sym.Variable('data')
label = mx.sym.Variable('label')
net = mx.sym.FullyConnected(data, num_hidden=1)
if use_custom:
net = mx.sym.MakeLoss(mx.sym.square(net - label))
else:
net = mx.sym.LinearRegressionOutput(net, label=label)
mod = mx.mod.Module(net, label_names=('label',))
mod.fit(iter, num_epoch=50, eval_metric='mse', optimizer='adam')
答案 0 :(得分:3)
这里回答的问题: https://discuss.mxnet.io/t/cannot-implement-customized-loss-function/797
您的自定义丢失按预期工作,您认为它没有收敛,因为eval_metric
正在使用您的网络输出(丢失)并将其与标签进行比较。在您的情况下,我将使用自定义评估指标,即身份函数。
mod = mx.mod.Module(net, label_names=['label'])
identity = mx.metric.CustomMetric(lambda x,y:y, name='mse_id')
mod.fit(iter, num_epoch=10, eval_metric=identity, optimizer='adam')
这给你这个:
INFO:root:Epoch[0] Train-mse_id=0.434285
INFO:root:Epoch[0] Time cost=0.056
INFO:root:Epoch[1] Train-mse_id=0.000387
INFO:root:Epoch[1] Time cost=0.055
INFO:root:Epoch[2] Train-mse_id=0.000000
INFO:root:Epoch[2] Time cost=0.055
INFO:root:Epoch[3] Train-mse_id=0.000000
INFO:root:Epoch[3] Time cost=0.055
INFO:root:Epoch[4] Train-mse_id=0.000000
INFO:root:Epoch[4] Time cost=0.055
INFO:root:Epoch[5] Train-mse_id=0.000000
INFO:root:Epoch[5] Time cost=0.056
INFO:root:Epoch[6] Train-mse_id=0.000000
INFO:root:Epoch[6] Time cost=0.056
INFO:root:Epoch[7] Train-mse_id=0.000000
INFO:root:Epoch[7] Time cost=0.056
INFO:root:Epoch[8] Train-mse_id=0.000000
INFO:root:Epoch[8] Time cost=0.056
INFO:root:Epoch[9] Train-mse_id=0.000000
INFO:root:Epoch[9] Time cost=0.056