Tesseract OCR-指定图案

时间:2019-01-04 12:26:32

标签: python ocr tesseract python-tesseract

我正在尝试使用Tesseract(3.04.00版)执行OCR。 我所有的图像都有相同的图案(数字点位数字,即精度为2位的十进制)。我尝试使用--user-patterns选项,但无法使用。

我做了什么:

  • 在第一行上用patterns.txt创建文件\d.\d\d
  • 使用选项--user-patterns patterns.txt

但是出现以下错误:

pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \\d.\\d\\d")

如何为Tesseract指定我的图案?这是正确的方法吗? 预先感谢您的帮助或建议,我在Tesseract上找不到太多文档。

EDIT :添加Python代码

img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)

1 个答案:

答案 0 :(得分:1)

没关系,我认为Tesseract对于我的用例而言过于矫kill过正。

我拍摄了从0到9的每个数字的图像,并选择了要预测的图像的最小均方误差。我的测试数据集具有100%的准确性。