使用代码:
import tesseract
api = tesseract.TessBaseAPI()
我有一个错误:
AttributeError:'module' object has no attribute 'TessBaseAPI'
使用 sudo apt-get install tesseract-ocr
答案 0 :(得分:0)
您确定正确的导入不是import pytesseract
吗?
如果是import tesseract
,您是否安装了最新版本并使用了 pip ?
也许这link可以帮到你。
你试过这个:
from tesserocr import PyTessBaseAPI
images = ['sample.jpg', 'sample2.jpg', 'sample3.jpg']
with PyTessBaseAPI() as api:
for img in images:
api.SetImageFile(img)
print api.GetUTF8Text()
print api.AllWordConfidences()
答案 1 :(得分:0)
就我而言,我需要安装C ++ tesseract库(而不仅仅是python包装器),并在初始化tesserocr API时为其提供路径:
from tesserocr import PyTessBaseAPI
api = PyTessBaseAPI(lang='eng', path=r'C:\python\envs\python36\Lib\site-packages\tesserocr\Tesseract-OCR\tessdata')
对于Windows 7,我有一个Windows安装程序,如下所示: https://osdn.net/projects/sfnet_tesseract-ocr-alt/downloads/tesseract-ocr-setup-3.02.02.exe/
请注意,有一个4.0版本,因此您应该在Google上搜索最新版本。
此外-路径专门指向从库创建的tessdata
文件夹。