Question

我目前有一个程序可以从网站上抓取足球数据并将其移植到dict：

 dict5[name] = ['To: ' + toteam, 'From: ' + fromteam, 'Price: ' + price, 'Date: ' + newdate]

该网站使用葡萄牙语，原生编码为UTF-8。 toteam，fromteam，price和dates都预先编码为UTF-8，只是与dict中的字符串连接在一起。程序运行得很好并打印到stdout毫无问题，当我尝试将其转储到这样的json文件时...

with open('test.json', 'w') as f:
  f.write(json.dumps(dict5, indent=2))

...它出现以下错误：

Traceback:....
C:\Python27\lib\json\__init__.py, line 238, in dumps
  **kw).encode(obj)
C:\Python27\lib\json\encoder.py, line 203, in encode
  chunks = list(chunks)
C:\Python27\lib\json\encoder.py, line 428, in _iterencode
  for chunk in _iterencode_dict(o, _current_indent_level):
C:\Python27\lib\json\encoder.py, line 381, in _iterencode_dict
  yield_encoder(key)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 0: invalid continuation byte

这实际上是另一个程序的副本，它使用相同的编码从同一个站点获取，但是一个可以正常工作。

我觉得有一些我不能理解的unicode-ness元素。任何人都可以对此有所了解吗？

Answer 1

toteam，fromteam，price和date都预先编码为utf-8

嗯你的问题。 Use unicodes instead.

JSON转储UnicodeDecodeError

1 个答案: