我正在尝试使用Tesseract(3.04.00版)执行OCR。
我所有的图像都有相同的图案(数字点位数字,即精度为2位的十进制)。我尝试使用--user-patterns
选项,但无法使用。
我做了什么:
patterns.txt
创建文件\d.\d\d
--user-patterns patterns.txt
但是出现以下错误:
pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \\d.\\d\\d")
如何为Tesseract指定我的图案?这是正确的方法吗? 预先感谢您的帮助或建议,我在Tesseract上找不到太多文档。
EDIT :添加Python代码
img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)
答案 0 :(得分:1)
没关系,我认为Tesseract对于我的用例而言过于矫kill过正。
我拍摄了从0到9的每个数字的图像,并选择了要预测的图像的最小均方误差。我的测试数据集具有100%的准确性。