我正在尝试使用Tesseract.js和我的网络摄像头(阅读我的身份证上的姓名)使用OCR提高字符识别的质量。
虽然Tesseract 4.0比tesseract.js(从3.04移植)更好地处理我的情况,但我仍然认为应该可以获得可用的结果 - 如果我能找出正确调整选项的位置的话!
到目前为止,除了设置正确的语言(包括特殊字符)之外,我还没有真正改进任何事情。你有任何改进建议吗?
到目前为止,我最好的配置似乎只是{ lan: 'dan' }
,我可以在数字上获得一致的好结果(80%左右的信心),但像MadsWårlich这样的名字一直被读作mm,MW和其他类似的无法比赛。
我尝试了不同的psm值,甚至用户特定的word文件输入(似乎不支持),我也考虑过尝试构建一组新的训练数据,因为字体可能很奇怪但是对于可能没有什么影响的事情,似乎有很多工作要做。
(图片被截断,因为我不想在这里包含我的全名,但它说明了我正在处理的图像的质量和类型。)
对于在这样的情况下我可以采取哪些措施来改善我的结果,你有什么好的建议吗?