我现在使用tesseract 2个月,并使用opencv减少图像中的点/噪声。但我正在尝试在tesseract级别解决此问题。 是否有任何tesseract参数可删除背景点? 还是我可以告诉tesseract不识别点(取决于大小)?
如果有人在这个问题上为我提供指导,我将非常感激。
对于下图: https://i.stack.imgur.com/9TjN6.png
我得到类似的输出。
lbane a a ee ee ee Ee ah Tani宣布tsi Ca Ee RR RAT CORRE NE REELE TTR EE TOTE TESES 请参阅©学生应安排21年工作时间... 芬·艾西 | fdvenced Coreral Sciemes©。 |。 eroral Home feonomits(仅限于。 普通法系(UL LE CL BE工会和高级职员)Dh 7od 1Art’SpeelaliAvt [对于那些tC meman Ta GET 由艺术主管推荐。 ii hal工艺美术
我正在使用以下命令运行tesseract: tesseract --psm 6 --oem 1 image.png output_text_file
答案 0 :(得分:0)
在tesseract级别上将没有任何噪声消除选项,因为不能对所有图像都推广预处理方法。您可以在opencv中使用去噪方法,例如fastNlMeansDenoising,Dilation,Erosion等。
答案 1 :(得分:0)
tesseract是OCR引擎,不是图像处理工具。