JSON转储UnicodeDecodeError

时间:2012-08-01 19:31:48

标签: python json unicode

我目前有一个程序可以从网站上抓取足球数据并将其移植到dict

 dict5[name] = ['To: ' + toteam, 'From: ' + fromteam, 'Price: ' + price, 'Date: ' + newdate]

该网站使用葡萄牙语,原生编码为UTF-8。 toteam,fromteam,price和dates都预先编码为UTF-8,只是与dict中的字符串连接在一起。程序运行得很好并打印到stdout毫无问题,当我尝试将其转储到这样的json文件时...

with open('test.json', 'w') as f:
  f.write(json.dumps(dict5, indent=2))

...它出现以下错误:

Traceback:....
C:\Python27\lib\json\__init__.py, line 238, in dumps
  **kw).encode(obj)
C:\Python27\lib\json\encoder.py, line 203, in encode
  chunks = list(chunks)
C:\Python27\lib\json\encoder.py, line 428, in _iterencode
  for chunk in _iterencode_dict(o, _current_indent_level):
C:\Python27\lib\json\encoder.py, line 381, in _iterencode_dict
  yield_encoder(key)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 0: invalid continuation byte

这实际上是另一个程序的副本,它使用相同的编码从同一个站点获取,但是一个可以正常工作。

我觉得有一些我不能理解的unicode-ness元素。任何人都可以对此有所了解吗?

1 个答案:

答案 0 :(得分:2)

  

toteam,fromteam,price和date都预先编码为utf-8

你的问题。 Use unicodes instead.