我在OCR seq2seq系统上工作。我有CNN-LSTM-LSTM enkoder-dekoder模型。 CNN由2个卷积层组成:
conv32-> relu-> bnorm-> conv64-> relu-> bnorm。
因此,例如,wan输入图像具有600x32px,第二个bnorm层输出之后将为150x8x64。比我重塑形状,所以它具有150x512。
我想问你,改形后的输出是否可以由LSTM编码器处理,还是有其他需要。我看到有人在重塑层后放置了一个尺寸为512的密实物体,然后使用LSTM对其进行了处理。当我尝试时,精度不会改变...那么,重塑后致密层的目的是什么?
谢谢