错误的unicode字符串

时间:2018-08-23 17:37:50

标签: mysql python-3.x character-encoding

我有一个带有utf8字符集的mysql数据库,但是我在一个表中有很多行,其文本如下:

War leider sehr entt\u00e4uscht.

代替:

War leider sehr enttäuscht.

我正在尝试使用python修复它,但是当我阅读它们时,它会返回:

War leider sehr entt\\u00e4uscht.

我尝试使用.encode(“ utf-8”)将其编码为utf8,但结果相同。

我尝试过的一件事是替换所有utf字符,例如:

body.replace("\\u00e4","\u00e4")

还有另一种方法吗?而不是替换所有字符? 谢谢建议

1 个答案:

答案 0 :(得分:0)

最后,我通过以下方式实现了它:

 codecs.decode(body, 'unicode-escape')