我的项目是使用python,opencv和scikit-learn识别手写的泰米尔字符。
输入文件:手写的泰米尔字母图片。
输出文件:文本文件中已识别的字符。
完成该项目的基本步骤是什么? 我知道三个步骤, 预处理,特征点提取和分类
但是,我不知道如何完成这个项目?
如何进行预处理?
在哪里存储训练数据集图像?
如何在opencv中提取特征点? 如何实现这个?
请帮忙......
答案 0 :(得分:8)
我正在开发手写阿拉伯字符识别和生成的同一个项目,但到目前为止我还没有使用opencv。因为在opencv中,您必须在图像上放置过滤器并处理该图像,并且每次都会获得相同大小的处理过的图像。但是在阿拉伯语中,每个角色都有很多变化,opencv对此没有用处。
对于你的问题,我也有一些建议和帮助材料。在开始之前,你必须做很多关于字符识别和你想要的一切的研究。阅读Alex Graves的研究论文,他对字符识别和生成做了大量研究。它会对你有所帮助。
我正在使用神经网络来达到此目的。最初,它有点难以理解,但是当你理解这一点时,你会得到你想要的一切。 Python也是非常好的语言。我有很多材料要学习神经网络以及如何训练你的数据集。我也有一些有用的链接,我在下面与您分享:
Alex Graves的个人资料:http://www.cs.toronto.edu/~graves/
神经网络理解:http://nikhilbuduma.com/2014/12/29/deep-learning-in-a-nutshell/ 视频:https://www.youtube.com/watch?v=q0pm3BrIUFo
Python中的神经网络代码:http://iamtrask.github.io/2015/07/12/basic-python-network/
希望它对你有所帮助。
由于