使用Urllib或Urllib2 python汇总验证码和其他值

时间:2013-09-05 12:39:26

标签: python urllib2 urllib

如何提交包含Captch图像的表格?试过这段代码

import urllib
import urllib2
from PIL import Image
import pytesser
#include the pytesser into the site pacakges 
#and run sudo apt-get tesseract-ocr it is required by the
#pytesser to run the image converter 

image = urllib.URLopener()
image.retrieve("http://www.stat.gov.pl/regon/Captcha.jpg","Captcha.jpg")
#The image get saved into current script directory
image = Image.open('Captcha.jpg')
print image_to_string(image) #I will get the text from the Captcha Image
text=image_to_string(image)

现在我想将此数据字典发送到帖子中已打开的请求,以便下一页包含详细信息

data={'criterion1TF':5213510101,'verifCodeTF':text}

但是当我使用的时候 urllib.URLopener() 它再次打开具有不同验证码图像的新页面。 我希望任何人都可以帮我解决这个问题。 提前谢谢。

1 个答案:

答案 0 :(得分:1)

这可能是因为您没有保存Cookie。 urllib2可以帮到你;如果你像这样设置你的开场白:

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

然后它将透明地保存并提交cookie。