我在c#中创建一个窗口表单应用程序。我能够从图像中读取文本但我在阅读终端文本时遇到问题(拍摄基于DOS的应用程序的屏幕截图并从中提取文本)我能够提取文本但是大部分字符都不正确,例如v是来了U,A来了R等所以请告诉我如何使用Tesseract this is the part of the image for which i m doing the OCR
正确准备终端文本非常感谢帮助。 谢谢
答案 0 :(得分:0)
Tesseract的默认OCR质量不太好。您需要train it for your fonts才能提高OCR质量。
快速替代方案是使用OCR.space(免费)或Google Cloud Vision或Microsoft Azure等online OCR服务。您可以在此处compare the ocr software API。
我用你的图片进行了快速测试,ocr.space工作得非常好(只是把你和v混淆了)和谷歌工作完美(没错)。