Python Requests响应与Chrome响应不同

时间:2018-08-23 12:02:23

标签: javascript python http captcha

我需要从特定网站下载大约100个验证码图像。 我的代码摘要为:

1-下载页面

2-搜索验证码图片网址(使用re)并下载

3- :(下载的图像与我在浏览器中看到的图像不同。我想会话或请求中的参数(获取或发布)中需要设置一个参数,而我没有设置。 / p>

import requests
import re
import time
s = requests.Session()
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}

#download this page and look for the url of the captcha image
page = s.get('http://www.rrk.ir/News/ShowOldNews.aspx?Code=1', headers=headers)
result = re.search('img id="imgCaptcha" src="..(.*)"', page.content.decode('utf-8'))
img_url = 'http://www.rrk.ir' + result.group(1).split('"')[0]

print(img_url)
#download the image and save it to a file
img = s.get(img_url, headers=headers)
img_file_name =  './a'  + '.jpg'
with open(img_file_name, 'wb') as fout:
    fout.write(img.content)

s.close()
#:( the downloaded file is different from what I see in Chrome.

如何找出我缺少的设置?

更新1 :根据建议,添加了自定义标头,但无济于事。

0 个答案:

没有答案