我需要从像这样的小图片中提取单词:
我在命令行中使用带有西班牙语语言选项的tesseract,如下所示:
tesseract category.png -l spa -psm 7 category.txt
我认为该文本必须易于通过OCR解析,但该字词无法识别。我使用-l spa
用于西班牙语和-psm 7
,因为图片只有一行(无论如何,如果我不使用-psm参数,结果是相同的)。
结果如下:s…"…
我正在使用lang包这个版本:http://domasofan.spdns.eu/tesseract/(github中引用的官方来源)