我目前有一个字母表中每个字母,大写字母的列表。字体是常量,即我的输入将始终是相同的字体。
鉴于字体是不变的,我真的需要多个字母,还是可以每个使用1个字母训练一个程序?如果我需要为每个字母添加多个图像,我可以通过机器学习算法运行相同的图像并假装它是第二个图像吗? (请注意,由于字体相同,因此第二个图像将完全相同)。
“打印屏幕”然后一次捕获一个特定的字母是很多工作,所以我基本上想知道我是否可以复制并粘贴所有图像50次以使我的52个样本大小变成2600样本量。
我正在python上使用scikit-learn,并将测试各种有监督的学习算法以识别这些字母。
答案 0 :(得分:0)
OCR不仅需要区分不同的字母,还要处理小旋转,翻译或变形等问题。
有用的神经网络(OCR的通用模型)需要针对包含这些变换的标记数据进行训练。你也许可以从每个字母的一个图像开始,并以编程方式旋转和翻译它以产生许多标记的训练样例。
就此而言,对于“原始”示例,您肯定可以使用所需字体渲染单个字母并将其保存到文件中,而不是使用文字截屏。