我是机器学习的初学者,我想尝试文本提取代码。这是我的代码:
import pytesseract from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe"
img = Image.open('image.png')
img.load()
imgString = pytesseract.image_to_string(img)
但是,这将导致以下错误:
TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'
我正在使用Jupyter Notebook(python 3)运行此程序。我能做些什么,还是有一种从图像中提取文本的简便方法?
答案 0 :(得分:1)
Image.load()方法
为图像分配存储空间并加载像素数据。通常情况下,您无需调用此方法,因为Image类在首次访问时会自动加载打开的图像。
img.load()
到
#img.load()
答案 1 :(得分:0)
可执行文件名错误,使用下面的代码,您将得到答案
pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"
其他代码行是文件。谢谢