嘿,我目前正在撰写论文,该论文旨在为乌尔都语构建OCR。我有文字,写在图像上。在CNN中,我知道有卷积和池化层可以学习模式或(提取特征)。我对RNN的了解是它学习序列。我想问一下RNN如何提取特征才能知道,图像中有什么?
答案 0 :(得分:1)
RNN网络使用随时间更新的隐藏层。根据减少的误差(或损失)进行采样并预测下一个采样。 LSTM是一种RNN,可以克服忘记长期依赖的问题。可能是这种类型,可能对您的论文有用。
答案 1 :(得分:0)
RNN 在训练阶段基本上需要一些功能和标签来学习数据中的序列。在数字数据没有问题的情况下,我们只需将数据集分为特征(X)和目标值(Y)。但是对于图像数据,我们使用CNN和RNN( CNN-RNN )的组合。在RNN层( LSTM或GRU )的顶部,卷积层用于从图像中提取特征,然后将这些特征馈送到RNN层。