标签: tensorflow keras conv-neural-network lstm
这是整体体系结构,我不理解另一个图像中描述的关注层(描述关注层实现的论文片段)。 换句话说,我如何实现公式H ^(t,l)= ....?
我当时正在考虑构建一个自定义的Lambda层来完成这项工作,但是我真的不知道如何编写自定义的Lambda函数。