所以,我有这个验证码我需要从中提取文本。
我一直在使用Pillow来完成这项工作,我已经从github尝试了很多其他的lib,但没有一个能正常工作。有了枕头,我收到了这个错误:
Traceback (most recent call last):
File "F:/Competitions/Donations/Scrapping.py", line 111, in <module>
Scrapping()
File "F:/Competitions/Donations/Scrapping.py", line 57, in __init__
myText = image_to_string(Image.open(filePath), config='-psm 10')
File "C:\Users\User Name\AppData\Roaming\Python\Python35\site-packages\pytesseract\pytesseract.py", line 161, in image_to_string
config=config)
File "C:\Users\User Name\AppData\Roaming\Python\Python35\site-packages\pytesseract\pytesseract.py", line 94, in run_tesseract
stderr=subprocess.PIPE)
File "C:\Pythons\Python3.5\lib\subprocess.py", line 947, in __init__
restore_signals, start_new_session)
File "C:\Pythons\Python3.5\lib\subprocess.py", line 1224, in _execute_child
startupinfo)
FileNotFoundError: [WinError 2] The system cannot find the file specified
这是基于image_to_string
方法的错误,我无法解决此问题。有什么建议吗?
这是我使用的代码:
myText = image_to_string(Image.open(filePath))
filePath
是图片的路径。
P.S:验证码图片:http://imgur.com/dRmna1z
答案 0 :(得分:1)
您似乎没有安装tesseract
或PATH
从the directions开始,您需要能够从命令行调用tesseract
。
您获得的实际错误与PIL
或Pillow
无关(请注意您的堆栈跟踪中没有列出PIL
个文件)。
实际错误来自here子处理到tesseract