我想在Tesserocr中添加语言。
在 Windows
上工作首先,我使用python 3.53为我的tesseract创建了一个专用的env,因为我保留了Root的其他用途。
然后我使用在Stackoverflow上找到的以下命令将其安装在Anaconda上: conda install -c simonflueckiger / label / tesseract-4.0.0-master tesserocr
Tesserocr安装正确,它会导入。
在[4]中:打印(tesserocr.tesseract_version()) tesseract 4.00.00alpha leptonica-1.75.3(2018年3月24日,15:32:11)[MSC v.1900 LIB版本x64] libgif 5.1.4:libjpeg 9b:libpng 1.6.34:libtiff 4.0.9:zlib 1.2.11:libwebp 0.6.1:libopenjp2 2.3.0
我通过PIL(图像)导入图像,当我尝试将其转换为文本(通过 tesserocr.image_to_text(image))时,出现以下消息:
* RuntimeError:无法初始化API,可能是无效的tessdata路径:C:\ Users \ my_id \ AppData \ Local \ Continuum \ anaconda3 \ envs *
然后,我尝试检查安装的语言,并收到以下消息: 在[18]中:print(tesserocr.get_languages()) (“ C:\ Users \ rb26241 \ AppData \ Local \ Continuum \ anaconda3 \ envs \”,[])
“ []”使我认为我的语言列表为空。试图找到如何在anaconda Windows上添加新内容,但没有找到足够的信息。你知道怎么做吗?