使用urllib2或urllib3或httplib2发布二进制数据时,收到错误UnicodeDecodeError: 'utf8' codec can't decode
或UnicodeDecodeError: 'ascii' codec can't decode...
,具体取决于Python脚本是处于UniCode还是ASCII模式。
我首先想到的是库是问题,所以我尝试了不同的库,但这并没有解决问题。
堆栈跟踪结束:
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/httplib.py", line 895, in _send_output
msg += message_body
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 627: invalid continuation byte
答案 0 :(得分:0)
问题,如对Python bug 11898的评论中所述,url字符串在某些时候被标记为Unicode或Ascii字符串。
然后,当httplib库为整个HTTP / S消息和行创建字节字符串时
msg += message_body
执行后,Python尝试将message_body
(包含二进制数据)转换为Ascii或Unicode。在任何一种情况下,转换都会失败。
<强>解决方案强>
在对网址进行任何修改时使用str()
。就我而言:
url = baseUrl + "/envelopes" # throws UnicodeDecodeError
url = str(baseUrl + "/envelopes") # works great
如果这还不够,请检查其他字符串以确保它们未被标记为Unicode或Ascii。