标签: c++ algorithm ocr
我为僧伽罗语(斯里兰卡语言)建立了光学字符识别。我在某种程度上取得了成功。现在我需要做的是使用字典数据进行后期处理。
将拼写错误的单词更改为正确单词的最佳方法是什么?任何人都可以提出建议吗?
我在unicode中有字典数据文件,而且我的OCR输出也是unicode文件。我是用C ++做的。到目前为止,我已经尝试过字符串匹配算法,但没有成功。我想开始解决这个问题最相关的方法。有人可以帮帮我吗?
提前致谢。