解码/编码外来字符/ UnicodeEncodeError:“ charmap”编解码器

时间:2019-03-05 13:13:34

标签: python json twitter decode encode

我正在尝试将一些tweet导出到json文件中,但出现错误。当我没有收到错误时,它会在数据中添加一个'b'字符,因此会弄乱我的json格式。这是我的示例和代码:

以下是“ tweets”的内容: ['МобильныйтелефонXiaomi Redmi 6 64GB / 4GB vs \ nМобильныйтелефонHuawei Honor 8X 64GB \ nпопопапараметрамсовпадаютнана…86,'  “小米Rilis Redmi Note 7 Pro di India,Ini Spesifikasinya”]

然后我将其转换为字符串:

tweets2=str(tweets)

当我尝试导出它时:

with open("tw_stream.jsonl", 'a') as f:
    f.write(tweets2)

我收到以下错误:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 2- 
10: character maps to <undefined>

所以问题是我试图删除字符串的'b \'部分,因为它不是有效的json,但是这样做时我无法将外来字符编码为“ utf-8” ...

如果有人可以帮助,将不胜感激。

谢谢:-)

1 个答案:

答案 0 :(得分:1)

您可以通过在其中传递param encoding =“ utf-8”来使用utf-8编码。