Pyocr不识别get_available_languages

时间:2014-05-28 18:21:58

标签: python import get ocr

我正在使用Python,无法从包pyocr加载语言。

from PIL import Image
import sys
import pyocr
from pyocr import builders
im=Image.open("Img1.gif")
tool=pyocr.get_available_tools()
lang = tool.get_available_languages()[0]

这里我得到“list object没有属性'get_available_languages'

如何解决它的任何想法?我从未使用过pyocr。

由于

2 个答案:

答案 0 :(得分:1)

tools是一个列表,您需要迭代它们; 这些项目是单独的工具:

for tool in pyocr.get_available_tools():
    for lang in tool.get_available_languages():
        print("Tool {} supports language {}".format(tool, lang))

或者,假设您知道要使用tesseract,可以直接导入它:

from pyocr import tesseract as tool

但是,工具列表反映了系统上安装的程序;要在tesseract中启用pyocr工具,您需要安装单独的tesseract程序。如果在命令路径中找到它,get_available_tools()将列出tesseract。 pyocr支持的其他工具是cuneiform

答案 1 :(得分:0)

如果len(tool) == 0(您在其他评论中建议),则表示tesseract上没有PATH。换句话说,如果您无法从shell运行Tesseract,PyOCR也找不到它。