CNN特征提取OCR

时间:2020-05-25 22:28:08

标签: ocr lstm feature-extraction seq2seq encoder-decoder

我在OCR seq2seq系统上工作。我有CNN-LSTM-LSTM enkoder-dekoder模型。 CNN由2个卷积层组成:

conv32-> relu-> bnorm-> conv64-> relu-> bnorm。

因此,例如,wan输入图像具有600x32px,第二个bnorm层输出之后将为150x8x64。比我重塑形状,所以它具有150x512。

我想问你,改形后的输出是否可以由LSTM编码器处理,还是有其他需要。我看到有人在重塑层后放置了一个尺寸为512的密实物体,然后使用LSTM对其进行了处理。当我尝试时,精度不会改变...那么,重塑后致密层的目的是什么?

谢谢

0 个答案:

没有答案