如何表示:
为什么?
答案 0 :(得分:17)
您必须将“页面分段模式”设置为“单个字符”。
例如,在Android中,您可以执行以下操作:
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
答案 1 :(得分:9)
您需要将Tesseract的页面分割模式设置为“单个字符”。
答案 2 :(得分:7)
你见过这个吗?
https://code.google.com/p/tesseract-ocr/issues/detail?id=581
错误列表显示“不再是问题”。
baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");
init Tesseract
代码
答案 3 :(得分:2)
执行该配置的python代码如下:
import pytesseract
import cv2
img = cv2.imread("path to some image")
pytesseract.image_to_string(img, config="-c tessedit"
"_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
" --psm 10"
" -l osd"
" "))
--psm
标志定义页面分割模式。
根据tesseract的文献记录,10
的意思是:
将图像作为单个字符处理。
因此,要识别单个字符,您只需使用--psm 10
标志。