用于通过移动设备从图像中提取文本的最佳ocr算法是什么 相机?
答案 0 :(得分:2)
这取决于您的应用要求。
通常OCR引擎只能返回字符,字体,字,行或区域信息。您需要添加许多其他模块并对其进行调整以获得最佳结果。
首先,相机OCR应用需要图像预处理。应尽可能添加背景,去除噪音,二值化,调整大小......以尽可能清洁图像。
其次,您需要找到文本区域。该算法不仅取决于图像特征,还取决于您的OCR目标。例如,如果需要OCR板号,则可以使用板号的长度,宽度或高度来获得更准确的位置。
OCR之后,您可以添加一些后期处理来纠正一些OCR错误。常见的OCR引擎,如Abyy,ExperVision,Omnipage,GOCR,Tesseract都是根据普通文件,杂志或办公用纸进行培训。如果您的文档很特殊,您可以通过OCR层建立高级数据提取或分析逻辑.Permalink