为什么tesseract OCR无法在c#中正确读取终端文本?

时间:2017-10-02 18:16:59

标签: c# winforms tesseract

我在c#中创建一个窗口表单应用程序。我能够从图像中读取文本但我在阅读终端文本时遇到问题(拍摄基于DOS的应用程序的屏幕截图并从中提取文本)我能够提取文本但是大部分字符都不正确,例如v是来了U,A来了R等所以请告诉我如何使用Tesseract this is the part of the image for which i m doing the OCR

正确准备终端文本

非常感谢帮助。 谢谢

1 个答案:

答案 0 :(得分:0)

Tesseract的默认OCR质量不太好。您需要train it for your fonts才能提高OCR质量。

快速替代方案是使用OCR.space(免费)或Google Cloud Vision或Microsoft Azure等online OCR服务。您可以在此处compare the ocr software API。

我用你的图片进行了快速测试,ocr.space工作得非常好(只是把你和v混淆了)和谷歌工作完美(没错)。