Python:POST二进制数据会产生UnicodeDecodeError或Ascii decode错误

时间:2016-01-24 10:10:45

标签: python-2.7

使用urllib2或urllib3或httplib2发布二进制数据时,收到错误UnicodeDecodeError: 'utf8' codec can't decodeUnicodeDecodeError: 'ascii' codec can't decode...,具体取决于Python脚本是处于UniCode还是ASCII模式。

我首先想到的是库是问题,所以我尝试了不同的库,但这并没有解决问题。

堆栈跟踪结束:

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/httplib.py", line 895, in _send_output
    msg += message_body
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 627: invalid continuation byte

1 个答案:

答案 0 :(得分:0)

问题,如对Python bug 11898的评论中所述,url字符串在某些时候被标记为Unicode或Ascii字符串。

然后,当httplib库为整个HTTP / S消息和行创建字节字符串时

msg += message_body

执行后,Python尝试将message_body(包含二进制数据)转换为Ascii或Unicode。在任何一种情况下,转换都会失败。

<强>解决方案 在对网址进行任何修改时使用str()。就我而言:

url = baseUrl + "/envelopes"      # throws UnicodeDecodeError
url = str(baseUrl + "/envelopes") # works great

如果这还不够,请检查其他字符串以确保它们未被标记为Unicode或Ascii。