Question

我是机器学习的初学者，我想尝试文本提取代码。这是我的代码：

import pytesseract from PIL import Image 
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe" 
img = Image.open('image.png') 
img.load()
imgString = pytesseract.image_to_string(img)

但是，这将导致以下错误：

TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'

我正在使用Jupyter Notebook（python 3）运行此程序。我能做些什么，还是有一种从图像中提取文本的简便方法？

Answer 1

Image.load（）方法

为图像分配存储空间并加载像素数据。通常情况下，您无需调用此方法，因为Image类在首次访问时会自动加载打开的图像。

img.load()

到

#img.load()

Answer 2

可执行文件名错误，使用下面的代码，您将得到答案

pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"

其他代码行是文件。谢谢

Python Tesseract：int（）参数必须是字符串，类似字节的对象或数字，而不是'tuple'

2 个答案: