我正在编写一个脚本,用于拍摄图像并将图像裁剪为仅包含我希望其识别的数字。我的那部分工作正常。数字将是一位或两位数。
我尝试使用Google Vision API,该API可以正常工作并给出正确的结果,但我宁愿在本地进行操作,以避免与使用该服务相关的费用。我目前正在使用Tesseract OCR https://github.com/tesseract-ocr/tesseract
我希望其识别的图像示例:
Tesseract是一个命令行程序,但是我在一个python文件中调用它,该文件也处理脚本的其他部分。我不确定Tesseract是否是我想要的,还是我的问题是否有更好的解决方案。
sudo tesseract imgName outputFile
无论输入什么图像,我得到的唯一结果都返回0,并显示“空页面!”
编辑:
我现在正在使用pytesseract,并且正在尝试使用此代码:
print(pytesseract.image_to_string(img))
没有任何输出,所以我尝试了
print(pytesseract.image_to_string(img,config ='--psm 6'))
输出猜测的随机字母。 tesseract是否有办法仅查找数字,以便缩小搜索范围?