Question

我正在尝试在CNTK中实现LSTM（使用Python）来对序列进行分类。

输入：

功能是固定长度的数字序列（时间序列）
标签是单热值的向量

网络：

input = input_variable(input_dim)
label = input_variable(num_output_classes)
h = Recurrence(LSTM(lstm_dim)) (input)
final_output = C.sequence.last(h)
z = Dense(num_output_classes) (final_output)
loss = C.cross_entropy_with_softmax(z, label)

输出： 序列与标签匹配的概率

所有尺寸都是固定的，所以我认为我不需要任何动态轴，也没有指定任何尺寸。

然而，CNTK并不开心，我得到了：

return cross_entropy_with_softmax(output_vector, target_vector, axis, name)
RuntimeError: Currently if an operand of a elementwise operation has any dynamic axes, those must match the dynamic axes of the other operands

如果（根据一些例子）我用动态轴定义标签

label = input_variable(num_output_classes, dynamic_axes=[C.Axis.default_batch_axis()])

它不再抱怨这一点，并进一步：

tf = np.split(training_features,num_minibatches)
tl = np.split(training_labels, num_minibatches)

for i in range(num_minibatches*num_passes): # multiply by the 
    features = np.ascontiguousarray(tf[i%num_minibatches])
    labels = np.ascontiguousarray(tl[i%num_minibatches])

    # Specify the mapping of input variables in the model to actual minibatch data to be trained with
    trainer.train_minibatch({input : features, label : labels})

但是因为这个错误而死：

  File "C:\Users\Dev\Anaconda3\envs\cntk-py34\lib\site-packages\cntk\cntk_py.py", line 1745, in train_minibatch
    return _cntk_py.Trainer_train_minibatch(self, *args)
RuntimeError: Node '__v2libuid__Plus561__v2libname__Plus552' (Plus operation): DataFor: FrameRange's dynamic axis is inconsistent with matrix: {numTimeSteps:1, numParallelSequences:100, sequences:[{seqId:0, s:0, begin:0, end:1}, {seqId:1, s:1, begin:0, end:1}, {seqId:2, s:2, begin:0, end:1}, {seqId:3, s:3, begin:0, end:1}, {seq...

我需要做些什么来解决这个问题？

Answer 1

如果我正确理解这一点，你就会有一维输入序列。如果是这样，那么你的麻烦就来自这条线

input =  input_variable(input_dim)

声明一系列input_dim维向量。如果将其更改为

input = input_variable(1)

然后我相信你的初步尝试应该有效。

更新：上述内容本身并不充分，因为获取序列的最后一个元素的操作会创建一个输出，其动态轴与创建标签的默认动态轴不同。一个简单的解决方法是在定义输出z之后定义标签

label = input_variable(num_output_classes, dynamic_axes=z.dynamic_axes)

这对我没有任何抱怨。然后我提供了一些这样的虚拟数据（假设一个4的序列长度为5和3类的小批量）

x = np.arange(20.0, dtype=np.float32).reshape(4,5,1)
y = np.array([1,0,0,0,1,0,0,0,1,0,0,1], dtype=np.float32).reshape(4,1,3)
loss.eval({input: x, label:y })

它按预期工作。

CNTK对LSTM中动态轴的抱怨

1 个答案: