Python json.load返回字符串而不是字典

时间:2016-07-13 20:34:29

标签: python json

我正在接受一个json文件,只将必要的密钥及其值复制到一个新的json文件中。我收到错误“TypeError:string indices必须是整数”,引用我将值复制到myDict的位置。从我收集的内容来看,json.load返回的是字符串而不是字典。我验证了json文件,它有有效的json格式。我正在使用Python 2.7.12。我到处搜索,但没找到能够解答我特定问题的答案。非常感谢您给予我的任何帮助。

import os
import sys
import json

def stripSpec(inp, outp):
    #Load json file as python dictionary
    obj  = json.load(open(inp, "r"))

    result=[]

    #Go through JSON and save necessary keys and values
    for i in obj:
        myDict = {}
        myDict["id"]=i.get('id').get('value')
        myDict["data"]["BaselineExposure"]=i.get('data').get('BaselineExposure').get('value')
        myDict["data"]["ColorMatrix2"]=i.get('data').get('ColorMatrix2').get('value')
        result.append(myDict)

    # Output the updated file with pretty JSON
    open(outp, "w").write(json.dumps(result, sort_keys=True, indent=4, ensure_ascii=False, separators=(',', ':')))
    return

#Save input and output paths as variables
inp = sys.argv[1]
outp = sys.argv[2]

#Call function
stripSpec(inp, outp)

json的一个例子就在这里。它已大幅减少,但基本上每个相机型号都有更多条目

[
{ "id": "Canon EOS 100D",
 "data":[{
  "SourceFile": "./Canon 100D/canon_eos_100d_11.dng",
  "ExifToolVersion": 10.07,
  "Directory": "./Canon 100D",
  "FileSize": "18 MB",
  "FileModifyDate": "2016:05:02 23:03:14-07:00",
  "FileAccessDate": "2016:05:03 01:45:03-07:00",
  "FileInodeChangeDate": "2016:05:02 23:03:14-07:00",
  "FilePermissions": "rw-r--r--",
  "ColorMatrix2": "0.6602 -0.0841 -0.0939 -0.4472 1.2458 0.2247 -0.0975 0.2039 0.6148",
  "CameraCalibration1": "1.0648 0 0 0 1 0 0 0 0.9881",
  "CameraCalibration2": "1.0648 0 0 0 1 0 0 0 0.9881",
  "AnalogBalance": "1 1 1",
  "AsShotNeutral": "0.512769 1 0.584809",
  "BaselineExposure": -0.25,
  "RedBalance": 1.950195
  }]
},

2 个答案:

答案 0 :(得分:2)

在您的json存根"data"键中包含列表。在您的代码中,您将其称为字典:i.get('data').get('BaselineExposure')

相反,您应该遍历"data"。 例如:

data = i.get('data')
for d in data:
    print(d.get('BaselineExposure'))

所以基本上要小心嵌套项目。

另外,为什么要使用i.get('id').get('value')。相反,i.get('id')应该足够了,而.get('value')应该提升AttributeError,不是吗?

答案 1 :(得分:0)

概述:我假设json存储为字典。我使用json.dumps将字典转换为json字符串。我点安装json2xml json2xml来转换json字符串,以便可以将其转换为xml。然后,我将xml加载到dom树中进行搜索。我使用getElementsByTagName在xml树中搜索该节点并显示该值。我的方法对程序员更友好。

from json2xml import json2xml
from json2xml.utils import readfromurl, readfromstring, readfromjson
from xml.dom.minidom import parse, parseString

dict={
  "id": "Canon EOS 100D",
  "data": [{
    "SourceFile": "./Canon 100D/canon_eos_100d_11.dng",
    "ExifToolVersion": 10.07,
    "Directory": "./Canon 100D",
    "FileSize": "18 MB",
    "FileModifyDate": "2016:05:02 23:03:14-07:00",
    "FileAccessDate": "2016:05:03 01:45:03-07:00",
    "FileInodeChangeDate": "2016:05:02 23:03:14-07:00",
    "FilePermissions": "rw-r--r--",
    "ColorMatrix2": "0.6602 -0.0841 -0.0939 -0.4472 1.2458 0.2247 -0.0975 0.2039 0.6148",
    "CameraCalibration1": "1.0648 0 0 0 1 0 0 0 0.9881",
    "CameraCalibration2": "1.0648 0 0 0 1 0 0 0 0.9881",
    "AnalogBalance": "1 1 1",
    "AsShotNeutral": "0.512769 1 0.584809",
    "BaselineExposure": -0.25,
    "RedBalance": 1.950195
    }]
 }

 #convert dictionary to a string
 json_data=json.dumps(dict,indent=4)
 data=readfromstring(json_data)
 xml=json2xml.Json2xml(data).to_xml()

 dom=parseString(xml)

 element=dom.getElementsByTagName('BaselineExposure') 
 print(element[0].firstChild.nodeValue)