我已经阅读了有关LSTM和RNN,甚至CTC的文章。据我了解,RNN用于计算序列中丢失的令牌(例如,句子中的单词)。但是,我的问题是读取用草书写的人的名字。许多名字并不流行,并且在语言模型中找不到,所以如果RNN仅预测缺少的单词,因为我没有可能的人名的完整数据集,它不会成功,对吧?
1)我可以使用RNN识别非标准单词吗? (例如稀有/不受欢迎的人名)
2)如果否,是否还有其他替代项。 ?还是我必须使用OCR的传统方法(尝试对字符进行细分然后分类)?
答案 0 :(得分:1)
基于CNN + RNN + CTC构建的神经网络在字符级上运行。 他们学会预测字符串,并且不在乎单词或底层语言。 您当然可以将字典和/或语言模型集成到CTC解码器中,但不必这样做。 这样,这样的网络仅通过查看字符就可以读取任意人的名字。 有关使用这种神经网络模型进行文本识别的高级介绍,请参见https://towardsdatascience.com/2326a3487cd5
仅需注意一点: RNN 用于沿序列传播信息,例如找出一个模棱两可的角色可能取决于周围的环境。