Python - 获取像XML一样编写的JSON信息

时间:2016-01-31 04:39:33

标签: python json python-2.7 parsing urllib2

在Python中,我通常使用这种模板做简单的JSON:

url = "url"
file = urllib2.urlopen(url)
json = file.read()
parsed = json.loads(json)

然后使用以下调用来获取变量:

parsed[obj name][value name]

但是,这适用于JSON,它的格式大致如下:

{'object':{'index':'value', 'index':'value'}}

我刚刚遇到的JSON格式如下:

{'index':'value', 'index':'value'},{'index':'value', 'index':'value'}

所以我没有名字可以引用不同的块。当然,块提供不同的信息,但具有相同的键#34; - 很像XML通常是格式化的。使用上面的方法,我将如何解析这个JSON?

2 个答案:

答案 0 :(得分:0)

结果必须是list的{​​{1}}:

dict

因此您可以使用数字引用它:[{'index1':'value1', 'index2':'value2'},{'index1':'value1', 'index2':'value2'}]

答案 1 :(得分:0)

以下不是有效的JSON。

{'index':'value', 'index':'value'},{'index':'value', 'index':'value'}

在哪里

[{'index':'value', 'index':'value'},{'index':'value', 'index':'value'}]是有效的JSON。

和python trackback显示

import json
string = "{'index':'value', 'index':'value'},{'index':'value', 'index':'value'}"
parsed = json.loads(string)
print parsed

Traceback (most recent call last):
  File "/Users/tron/Desktop/test3.py", line 3, in <module>
    parsed_json = json.loads(json_string)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 338, in loads
    return _default_decoder.decode(s)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/decoder.py", line 369, in decode
    raise ValueError(errmsg("Extra data", s, end, len(s)))
ValueError: Extra data: line 1 column 27 - line 1 column 54 (char 26 - 53)
[Finished in 0.0s with exit code 1]

如果你这样做

json_string = '[{"a":"value", "b":"value"},{"a":"value", "b":"value"}]'

一切正常。

如果是这种情况,您可以将其称为Jsons数组。其中json_string[0]是第一个JSON字符串。 json_string[1]是第二个,依此类推。

否则,如果您认为这将成为您“必须处理”的问题。这是一个选项:

想想JSON可能出错的方式,并编写一个简单的类来解释它们。在上面的例子中,这是一个你可以处理它的hacky方式。

import json
json_string = '{"a":"value", "b":"value"},{"a":"value", "b":"value"}'
def parseJson(string):
    parsed_json = None
    try:
        parsed_json = json.loads(string)
        print parsed_json
    except ValueError, e:
        print string, "didnt parse"
        if  "Extra data" in str(e.args):
            newString = "["+string+"]"
            print newString
            return parseJson(newString)

你可以添加更多if / else来处理你遇到的各种事情。我不得不承认,这是非常hacky,我认为你不能解释每个可能的突变。

祝你好运