使用NN进行不同大小文本的OCR?

时间:2015-02-28 11:45:00

标签: neural-network ocr pattern-recognition

如何处理图像中输入字符字体大小与训练大小不同的模式的识别?如何将此输入到我训练过的神经网络?目前我只知道前馈神经网络,我认为它们已经足够了。我还需要别的吗?

1 个答案:

答案 0 :(得分:3)

大多数实际系统都会进行一些预处理,如边缘检测,然后是字符缩放和字符缩放(参见本文for example)。因此,所有字符都缩放到相同的大小。可以尝试其他方法,例如训练NN以识别一些小窗口作为字符的一部分或不是字符的一部分(同时给出更大的上下文窗口),然后合并相邻的部分(如用面部识别完成)。有关此主题的更多信息,请参阅this paper,其中讨论了使用NN进行文本检测的可能性,而无需预处理