我目前有一个程序可以从网站上抓取足球数据并将其移植到dict
:
dict5[name] = ['To: ' + toteam, 'From: ' + fromteam, 'Price: ' + price, 'Date: ' + newdate]
该网站使用葡萄牙语,原生编码为UTF-8。 toteam,fromteam,price和dates都预先编码为UTF-8,只是与dict
中的字符串连接在一起。程序运行得很好并打印到stdout
毫无问题,当我尝试将其转储到这样的json文件时...
with open('test.json', 'w') as f:
f.write(json.dumps(dict5, indent=2))
...它出现以下错误:
Traceback:....
C:\Python27\lib\json\__init__.py, line 238, in dumps
**kw).encode(obj)
C:\Python27\lib\json\encoder.py, line 203, in encode
chunks = list(chunks)
C:\Python27\lib\json\encoder.py, line 428, in _iterencode
for chunk in _iterencode_dict(o, _current_indent_level):
C:\Python27\lib\json\encoder.py, line 381, in _iterencode_dict
yield_encoder(key)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 0: invalid continuation byte
这实际上是另一个程序的副本,它使用相同的编码从同一个站点获取,但是一个可以正常工作。
我觉得有一些我不能理解的unicode-ness元素。任何人都可以对此有所了解吗?