应用错误收集

我正在尝试使用python开发我的第一个ocr项目。我也是Python的新手。

我正在使用OpenCV 3和Python 3.6。我正在尝试从文档中进行OCR。

使用OpenCV我已将图像转换为白色bg和黑色文本。它正在阅读大部分图像。但为了提高准确性，我想将模式列表传递给OCR引擎。

pytesseract可以吗？

例如，我正在尝试提取客户ID，并且只有很少的客户ID，我可以提供那些提高准确性的列表。

与日期相同，我知道它总是采用特定的日期格式，如果我可以提供日期格式以提高准确性......

这些都有可能吗？如果是，任何人都可以建议我怎么做？

我曾尝试搜索堆栈溢出和谷歌，但找不到太多帮助。

任何指导或指示都会有所帮助......