我目前正在尝试在tetrisfriends.com上编写一个机器人来玩俄罗斯方块来练习机器学习,但我已经陷入困境。我试图找到一种方法从游戏中读取玩家得分,但Tesseract不识别字体/数字,我不认为我可以重新训练Tesseract识别数字,因为它不是一个完整的字体是使用,只是数字。
我正在尝试从中读取数字的图像是: https://imgur.com/a/OVwV5
当我使用Tesseract时,我可以让它识别页面上的其他单词,而不是我需要的那些数字。
有没有人有办法通过重新训练Tesseract,另一种方法或任何其他方式来做到这一点?
答案 0 :(得分:3)
我特别不熟悉Tesseract,但这可能不是你最好的选择。如果最终目标只是制作机器人,你可以直接从应用程序中提取文本而不是担心OCR,但是如果你想了解更多有关机器学习的知识并且你还没有完成它们{{{ 3}}和MNIST数据集是很好的起点。
反正!您尝试测试的图像具有非常低的对比度,并且字体风格很大。看看网站本身看起来像是黄色的字符:
如果您对图像进行了预处理,使黄色像素为黑色,而其他所有图像都为白色,则可以使用更清晰的光源来处理,例如:
如果您想推进Tesseract,并且预处理不够,那么您可能需要重新训练此字体。您需要准备一个语料库,按照您希望源数据的外观进行处理,然后使用qt-box-editor之类的方法来纠正数据。这个CIFAR-10应该能够引导您完成再培训的基本步骤。