应用错误收集

我有一个UTF-8编码的字节字符串。末尾的某些字节丢失。当我尝试decode()时，出现“意外的数据结尾”错误。一个玩具示例：

>>> a = "\u2e90\u2e91\u2e92".encode("utf-8")
>>> len(a)
9
>>> a[0:8].decode("utf-8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 6-7: unexpected end of data

解码除最后一个（断点）代码点以外的所有代码点的最优雅方法是什么？

如何解码不完整的UTF-8编码的字节字符串

0 个答案: