首先,我在github上使用来自charlesw的C#的tesseract包装器,这是我的问题的一个例子:
上传可能会旋转90度 -
这就是Tesseract给我的回复:
多数民众赞成......没什么:/ 我尝试了以下的事情(或多或少成功..好吧......大多数情况下): 将DPI设置为300, 纯B& W(如此样本图片), 切掉所有的边界, 增加对比度
我认为主要问题是这个“被打破”的问题。字体。有没有办法训练这个字体的包装,如果是这样,怎么样? 对于我的所有图像,它总是完全相同的字体和大致相同的排列。
非常感谢你的时间,我真的很感激。