尝试使用
从终端运行tesseractTesseract Open Source OCR Engine v3.04.01 with Leptonica
read_params_file: Can't open 1
read_params_file: Can't open psm
read_params_file: Can't open 11
Detected 22 diacritics
这就是我得到的:
AppServiceHub
创建输出,但是我不应该使用配置参数。
知道这可能是什么吗?
答案 0 :(得分:0)
如tesseract CLI wiki中所述,对于 oem 和 psm 选项,应使用双破折号
OCR options:
--tessdata-dir PATH Specify the location of tessdata path.
--user-words PATH Specify the location of user words file.
--user-patterns PATH Specify the location of user patterns file.
-l LANG[+LANG] Specify language(s) used for OCR.
-c VAR=VALUE Set value for config variables.
Multiple -c arguments are allowed.
--psm NUM Specify page segmentation mode.
--oem NUM Specify OCR Engine mode.
因此,在您的情况下,正确的行将是
tesseract 1_clean2.png output -l eng --oem 1 --psm 11