使用tesseract image_to_string函数

时间:2017-03-06 00:38:50

标签: python-3.x opencv ocr opencv3.0 python-tesseract

我正在尝试使用python开发我的第一个ocr项目。我也是Python的新手。

我正在使用OpenCV 3和Python 3.6。我正在尝试从文档中进行OCR。

使用OpenCV我已将图像转换为白色bg和黑色文本。它正在阅读大部分图像。但为了提高准确性,我想将模式列表传递给OCR引擎。

pytesseract可以吗?

例如,我正在尝试提取客户ID,并且只有很少的客户ID,我可以提供那些提高准确性的列表。

与日期相同,我知道它总是采用特定的日期格式,如果我可以提供日期格式以提高准确性......

这些都有可能吗?如果是,任何人都可以建议我怎么做?

我曾尝试搜索堆栈溢出和谷歌,但找不到太多帮助。

任何指导或指示都会有所帮助......

0 个答案:

没有答案