我想向应该使用.csv文件回复的HTTPS站点发送帖子请求。 我有这个Python代码:
url = 'https://www.site.com/servlet/datadownload'
values = {
'val1' : '123',
'val2' : 'abc',
'val3' : '1b3',
}
data = urllib.urlencode(values)
req = urllib2.Request(url,data)
response = urllib2.urlopen(req)
myfile = open('file.csv', 'wb')
shutil.copyfileobj(response.fp, myfile)
myfile.close()
但是我得到了错误:
BadStatusLine: '' (in httplib.py)
我已尝试使用Chrome扩展程序:高级REST客户端(screenshot)进行发布请求,并且工作正常。
可能是什么问题,我该如何解决? (是因为HTTPS吗?)
编辑,重构代码:
try:
#conn = httplib.HTTPSConnection(host="www.site.com", port=443)
=>出现BadStatusLine: ''
错误
conn = httplib.HTTPConnection("www.site.com");
params = urllib.urlencode({'val1':'123','val2':'abc','val3':'1b3'})
conn.request("POST", "/nps/servlet/exportdatadownload", params)
content = conn.getresponse()
print content.reason, content.status
print content.read()
conn.close()
except:
import sys
print sys.exc_info()[:2]
输出:
Found 302
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML><HEAD>
<TITLE>302 Found</TITLE>
</HEAD><BODY>
<H1>Found</H1>
The document has moved <A HREF="https://www.site.com/nps/servlet/exportdatadownload">here</A>.<P>
<HR>
<ADDRESS>Oracle-Application-Server-10g/10.1.3.5.0 Oracle-HTTP-Server Server at mp-www1.mrco.be Port 7778</ADDRESS>
</BODY></HTML>
我做错了什么?
答案 0 :(得分:11)
你有没有理由使用urllib
? Requests几乎在所有方面都更简单,更好,并且抽象出使urllib
难以使用的一些瑕疵。
作为一个例子,我将你的例子修改为:
import requests
resp = requests.post(url, data=values, allow_redirects=True)
此时,来自服务器的响应在resp.text
中可用,您可以使用它执行您想要的操作。如果请求无法正确发送(例如,因为您需要自定义SSL证书),它应该会给您一个很好的错误消息,告诉您原因。
即使您不能在生产环境中执行此操作,也请在本地shell中执行此操作,以查看从requests
获取的错误消息,并使用它来调试urllib
。
答案 1 :(得分:3)
BadStatusLine: '' (in httplib.py)
表示此处可能还有其他内容。当服务器完全没有发回应答时,可能会发生这种情况,只是关闭连接。
正如您所提到的那样,您正在使用SSL连接,这可能对调试特别有意义(如果您愿意,可以使用curl -v URL
)。
如果您发现curl -2 URL
(强制使用SSLv2)似乎有效,而curl -3 URL
(SSLv3)则不然,您可能需要查看问题#13636可能是#11220在python bugtracker上。取决于您的Python版本和可能配置错误的Web服务器,这可能会导致问题:SSL默认值在v2.7.3中已更改。
答案 2 :(得分:1)
conn = httplib.HTTPSConnection(host='www.site.com', port=443, cert_file=_certfile)
params = urllib.urlencode({'cmd': 'token', 'device_id_st': 'AAAA-BBBB-CCCC',
'token_id_st':'DDDD-EEEE_FFFF', 'product_id':'Unit Test',
'product_ver':"1.6.3"})
conn.request("POST", "servlet/datadownload", params)
content = conn.getresponse().read()
#print response.status, response.reason
conn.close()
答案 3 :(得分:0)
服务器可能不喜欢丢失的标头,尤其是用户代理和内容类型。 Chrome图片会显示用于这些内容的内容。也许尝试添加标题:
import httplib, urllib
host = 'www.site.com'
url = '/servlet/datadownload'
values = {
'val1' : '123',
'val2' : 'abc',
'val3' : '1b3',
}
headers = {
'User-Agent': 'python',
'Content-Type': 'application/x-www-form-urlencoded',
}
values = urllib.urlencode(values)
conn = httplib.HTTPSConnection(host)
conn.request("POST", url, values, headers)
response = conn.getresponse()
data = response.read()
print 'Response: ', response.status, response.reason
print 'Data:'
print data
这是未经测试的代码,您可能需要尝试添加其他标头值以匹配您的屏幕截图。希望它有所帮助。