Python Tesseract:int()参数必须是字符串,类似字节的对象或数字,而不是'tuple'

时间:2019-02-04 05:07:52

标签: python machine-learning tesseract text-recognition python-tesseract

我是机器学习的初学者,我想尝试文本提取代码。这是我的代码:

import pytesseract from PIL import Image 
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe" 
img = Image.open('image.png') 
img.load()
imgString = pytesseract.image_to_string(img)

但是,这将导致以下错误:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'

我正在使用Jupyter Notebook(python 3)运行此程序。我能做些什么,还是有一种从图像中提取文本的简便方法?

2 个答案:

答案 0 :(得分:1)

Image.load()方法

为图像分配存储空间并加载像素数据。通常情况下,您无需调用此方法,因为Image类在首次访问时会自动加载打开的图像。

img.load()

#img.load()

答案 1 :(得分:0)

可执行文件名错误,使用下面的代码,您将得到答案

pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"

其他代码行是文件。谢谢