应用错误收集

时间：2017-11-15 17:25:48

标签： python opencv machine-learning artificial-intelligence tesseract

我目前正在尝试在tetrisfriends.com上编写一个机器人来玩俄罗斯方块来练习机器学习，但我已经陷入困境。我试图找到一种方法从游戏中读取玩家得分，但Tesseract不识别字体/数字，我不认为我可以重新训练Tesseract识别数字，因为它不是一个完整的字体是使用，只是数字。

我正在尝试从中读取数字的图像是： https://imgur.com/a/OVwV5

当我使用Tesseract时，我可以让它识别页面上的其他单词，而不是我需要的那些数字。

有没有人有办法通过重新训练Tesseract，另一种方法或任何其他方式来做到这一点？

答案 0 :(得分：3)

我特别不熟悉Tesseract，但这可能不是你最好的选择。如果最终目标只是制作机器人，你可以直接从应用程序中提取文本而不是担心OCR，但是如果你想了解更多有关机器学习的知识并且你还没有完成它们{{{ 3}}和MNIST数据集是很好的起点。

反正！您尝试测试的图像具有非常低的对比度，并且字体风格很大。看看网站本身看起来像是黄色的字符：

before

如果您对图像进行了预处理，使黄色像素为黑色，而其他所有图像都为白色，则可以使用更清晰的光源来处理，例如：

after

如果您想推进Tesseract，并且预处理不够，那么您可能需要重新训练此字体。您需要准备一个语料库，按照您希望源数据的外观进行处理，然后使用qt-box-editor之类的方法来纠正数据。这个CIFAR-10应该能够引导您完成再培训的基本步骤。