应用错误收集

为什么tesseract OCR无法在c＃中正确读取终端文本？

时间：2017-10-02 18:16:59

标签： c# winforms tesseract

我在c＃中创建一个窗口表单应用程序。我能够从图像中读取文本但我在阅读终端文本时遇到问题（拍摄基于DOS的应用程序的屏幕截图并从中提取文本）我能够提取文本但是大部分字符都不正确，例如v是来了U，A来了R等所以请告诉我如何使用Tesseract this is the part of the image for which i m doing the OCR

正确准备终端文本

非常感谢帮助。谢谢

1 个答案:

答案 0 :(得分：0)

Tesseract的默认OCR质量不太好。您需要train it for your fonts才能提高OCR质量。

快速替代方案是使用OCR.space（免费）或Google Cloud Vision或Microsoft Azure等online OCR服务。您可以在此处compare the ocr software API。

我用你的图片进行了快速测试，ocr.space工作得非常好（只是把你和v混淆了）和谷歌工作完美（没错）。

Tesseract只读取文本中的数字
有没有理由为什么Ruby Tesseract gem没有正确检测粗体文本？
阅读表格图像中的文字
Tesseract OCR库对图像的要求是什么才能准确提取文本？
tesseract无法准确读取所有数字
无法使用Mobile Vision API从图像中读取文本
为什么tesseract OCR无法在c＃中正确读取终端文本？
使用c＃和Tesseract读取.jpeg图像文本
不能使用PixConverter.ToPix Leptonica C＃
Tesseract OCR无法正确分割线

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？