' UTF8'编解码器在解码(' utf-8')时不能解码字节0xc3

时间:2017-12-24 20:25:21

标签: python encoding utf-8

今天我的剧本中出现了奇怪的错误:

'utf8' codec can't decode byte 0xc3 in position 21: invalid continuation byte

我正在从套接字sock.recv读取数据,结果是buff.decode('utf-8'),其中buff是返回的数据。

但今天我发现了很多"独角兽"其中一个角色返回"▒" < - 这就是将utf-8解码为异常的原因。是否有一些预处理可以删除或替换这样一个奇怪的角色?

1 个答案:

答案 0 :(得分:5)

名为error: structure has no member 'message' error: called from submitWithConfiguration at line 35 column 5 submit at line 30 column 3 的{​​{3}}有第二个参数。您可以将其设置为errors以忽略所有非utf8字符,或将其设置为'ignore'以使用菱形问号(�)替换它们。

'replace'