我有一个大型的json文件,其中包含两个json对象列表。
示例数据:
[{"a":1}][{"b":2}]
import json
message = json.load(open("data.json"))
for m in message:
print m
按预期,我收到ValueError。
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 290, in load
**kw)
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 338, in loads
return _default_decoder.decode(s)
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/decoder.py", line 369, in decode
raise ValueError(errmsg("Extra data", s, end, len(s)))
ValueError: Extra data: line 1 column 10 - line 1 column 19 (char 9 - 18)
我想到了通过跟踪字符数来分割文件。 处理此问题的Python方法是什么?
答案 0 :(得分:2)
您可以使用json.JSONDecoder.raw_decode()
来解析一个完整的对象,并返回其结尾处的字符位置,从而允许您遍历每个对象:
from json import JSONDecoder, JSONDecodeError
decoder = JSONDecoder()
data = '[{"a":1}][{"b":2}]'
pos = 0
while True:
try:
o, pos = decoder.raw_decode(data, pos)
print(o)
except JSONDecodeError:
break
结果:
[{'a': 1}]
[{'b': 2}]