应用错误收集

时间：2013-07-28 17:54:30

标签： machine-learning

我目前有一个字母表中每个字母，大写字母的列表。字体是常量，即我的输入将始终是相同的字体。

鉴于字体是不变的，我真的需要多个字母，还是可以每个使用1个字母训练一个程序？如果我需要为每个字母添加多个图像，我可以通过机器学习算法运行相同的图像并假装它是第二个图像吗？（请注意，由于字体相同，因此第二个图像将完全相同）。

“打印屏幕”然后一次捕获一个特定的字母是很多工作，所以我基本上想知道我是否可以复制并粘贴所有图像50次以使我的52个样本大小变成2600样本量。

我正在python上使用scikit-learn，并将测试各种有监督的学习算法以识别这些字母。

答案 0 :(得分：0)

OCR不仅需要区分不同的字母，还要处理小旋转，翻译或变形等问题。

有用的神经网络（OCR的通用模型）需要针对包含这些变换的标记数据进行训练。你也许可以从每个字母的一个图像开始，并以编程方式旋转和翻译它以产生许多标记的训练样例。

就此而言，对于“原始”示例，您肯定可以使用所需字体渲染单个字母并将其保存到文件中，而不是使用文字截屏。