Question

我正在尝试使用Tesseract（3.04.00版）执行OCR。我所有的图像都有相同的图案（数字点位数字，即精度为2位的十进制）。我尝试使用--user-patterns选项，但无法使用。

我做了什么：

在第一行上用patterns.txt创建文件\d.\d\d
使用选项--user-patterns patterns.txt

但是出现以下错误：

pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \\d.\\d\\d")

如何为Tesseract指定我的图案？这是正确的方法吗？预先感谢您的帮助或建议，我在Tesseract上找不到太多文档。

EDIT ：添加Python代码

img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)

Answer 1

没关系，我认为Tesseract对于我的用例而言过于矫kill过正。

我拍摄了从0到9的每个数字的图像，并选择了要预测的图像的最小均方误差。我的测试数据集具有100％的准确性。

Tesseract OCR-指定图案

1 个答案: