我正在尝试使用python开发我的第一个ocr项目。我也是Python的新手。
我正在使用OpenCV 3和Python 3.6。我正在尝试从文档中进行OCR。
使用OpenCV我已将图像转换为白色bg和黑色文本。它正在阅读大部分图像。但为了提高准确性,我想将模式列表传递给OCR引擎。
pytesseract可以吗?
例如,我正在尝试提取客户ID,并且只有很少的客户ID,我可以提供那些提高准确性的列表。
与日期相同,我知道它总是采用特定的日期格式,如果我可以提供日期格式以提高准确性......
这些都有可能吗?如果是,任何人都可以建议我怎么做?
我曾尝试搜索堆栈溢出和谷歌,但找不到太多帮助。
任何指导或指示都会有所帮助......