我正在使用Python,无法从包pyocr加载语言。
from PIL import Image
import sys
import pyocr
from pyocr import builders
im=Image.open("Img1.gif")
tool=pyocr.get_available_tools()
lang = tool.get_available_languages()[0]
这里我得到“list object没有属性'get_available_languages'
如何解决它的任何想法?我从未使用过pyocr。
由于
答案 0 :(得分:1)
tools
是一个列表,您需要迭代它们;
这些项目是单独的工具:
for tool in pyocr.get_available_tools():
for lang in tool.get_available_languages():
print("Tool {} supports language {}".format(tool, lang))
或者,假设您知道要使用tesseract
,可以直接导入它:
from pyocr import tesseract as tool
但是,工具列表反映了系统上安装的程序;要在tesseract
中启用pyocr
工具,您需要安装单独的tesseract
程序。如果在命令路径中找到它,get_available_tools()
将列出tesseract。 pyocr
支持的其他工具是cuneiform
。
答案 1 :(得分:0)
如果len(tool) == 0
(您在其他评论中建议),则表示tesseract
上没有PATH
。换句话说,如果您无法从shell运行Tesseract,PyOCR
也找不到它。