我正在尝试将一些tweet导出到json文件中,但出现错误。当我没有收到错误时,它会在数据中添加一个'b'字符,因此会弄乱我的json格式。这是我的示例和代码:
以下是“ tweets”的内容: ['МобильныйтелефонXiaomi Redmi 6 64GB / 4GB vs \ nМобильныйтелефонHuawei Honor 8X 64GB \ nпопопапараметрамсовпадаютнана…86,' “小米Rilis Redmi Note 7 Pro di India,Ini Spesifikasinya”]
然后我将其转换为字符串:
tweets2=str(tweets)
当我尝试导出它时:
with open("tw_stream.jsonl", 'a') as f:
f.write(tweets2)
我收到以下错误:
UnicodeEncodeError: 'charmap' codec can't encode characters in position 2-
10: character maps to <undefined>
所以问题是我试图删除字符串的'b \'部分,因为它不是有效的json,但是这样做时我无法将外来字符编码为“ utf-8” ...
如果有人可以帮助,将不胜感激。
谢谢:-)
答案 0 :(得分:1)
您可以通过在其中传递param encoding =“ utf-8”来使用utf-8编码。