为什么Python不能解析这个JSON数据?

时间:2010-05-14 15:54:20

标签: python json parsing

我在文件中有这个JSON:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

我编写了这个脚本来打印所有JSON数据:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

这个程序引发了例外:

Traceback (most recent call last):
  File "<pyshell#1>", line 5, in <module>
    data = json.load(f)
  File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
    obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)

如何解析JSON并提取其值?

9 个答案:

答案 0 :(得分:2041)

您的数据无效JSON格式。如果您应该[]

,则{}
  • []适用于JSON数组,在Python中称为list
  • {}适用于JSON对象,在Python中称为dict

以下是您的JSON文件的外观:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

然后你可以使用你的代码:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

使用数据,您现在还可以找到如下值:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

尝试一下,看看它是否有意义。

答案 1 :(得分:301)

您的data.json应如下所示:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

您的代码应为:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

请注意,这仅适用于Python 2.6及更高版本,因为它取决于with-statement。在Python 2.5中使用from __future__ import with_statement,在Python&lt; = 2.4中,请参阅Justin Peel's answer,这个答案基于此。

您现在还可以访问以下单个值:

data["maps"][0]["id"]  # will return 'blabla'
data["masks"]["id"]    # will return 'valore'
data["om_points"]      # will return 'value'

答案 2 :(得分:64)

Justin Peel's answer非常有用,但是如果您使用的是Python 3,那么JSON应该像这样完成:

with open('data.json', encoding='utf-8') as data_file:
    data = json.loads(data_file.read())

注意:使用json.loads代替json.load。在Python 3中,json.loads采用字符串参数。 json.load采用类似文件的对象参数。 data_file.read()返回一个字符串对象。

老实说,我认为在大多数情况下将所有json数据加载到内存中并不是一个问题。

答案 3 :(得分:52)

data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))

答案 4 :(得分:13)

“Ultra JSON”或简单地“ujson”可以处理JSON文件输入中的[]。如果您正在将JSON输入文件作为JSON元素列表读入程序中;例如,[{[{}]}, {}, [], etc...] ujson可以处理任何字典列表,列表字典的任意顺序。

您可以在Python package index中找到ujson,API与Python的内置json库几乎完全相同。

如果您正在加载更大的JSON文件,那么ujson也会快得多。您可以在提供的同一链接中查看与其他Python JSON库相比较的性能详细信息。

答案 5 :(得分:7)

如果您正在使用Python3,可以尝试将您的(connection.json文件)JSON更改为:

{
  "connection1": {
    "DSN": "con1",
    "UID": "abc",
    "PWD": "1234",
    "connection_string_python":"test1"
  }
  ,
  "connection2": {
    "DSN": "con2",
    "UID": "def",
    "PWD": "1234"
  }
}

然后使用以下代码:

connection_file = open('connection.json', 'r')
conn_string = json.load(connection_file)
conn_string['connection1']['connection_string_python'])
connection_file.close()
>>> test1

答案 6 :(得分:6)

您可以使用修改后的data.json文件:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [{
        "id": "valore"
    }],
    "om_points": "value",
    "parameters": [{
        "id": "valore"
    }]
}

您可以使用以下行在控制台上调用或打印数据:

import json
from pprint import pprint
with open('data.json') as data_file:
    data_item = json.load(data_file)
pprint(data_item)

print(data_item['parameters'][0]['id'])的预期输出:

{'maps': [{'id': 'blabla', 'iscategorical': '0'},
          {'id': 'blabla', 'iscategorical': '0'}],
 'masks': [{'id': 'valore'}],
 'om_points': 'value',
 'parameters': [{'id': 'valore'}]}

print(data_item['parameters'][0]['id'])的预期输出:

valore

答案 7 :(得分:4)

此解析有两种类型。

  1. 从系统路径中的文件中解析数据
  2. 从远程URL解析JSON。

从文件中,您可以使用以下

import json
json = json.loads(open('/path/to/file.json').read())
value = json['key']
print json['value']

此小节解释了使用两种方案的完整解析和获取值。Parsing JSON using Python

答案 8 :(得分:4)

作为python3用户

loadloads方法之间的区别很重要,尤其是当您从文件中读取json数据时。

如文档所述:

json.load:

  

反序列化fp(支持.read()的文本文件或二进制文件   包含JSON文档的文件)到使用此对象的Python对象   转换表。

json.loads:

  

json.loads:反序列化s(一个str,字节或字节数组实例   包含一个JSON文档)到使用此转换的Python对象   桌子。

json.load方法可以读取二进制文件,因此可以直接读取打开的json文档。

with open('./recipes.json') as data:
  all_recipes = json.load(data)

结果,您的json数据将按照此转换表指定的格式提供:

https://docs.python.org/3.7/library/json.html#json-to-py-table