我有两个JSON文件。
档案A:
"features": [
{
"attributes": {
"NAME": "R T CO",
"LTYPE": 64,
"QUAD15M": "279933",
"OBJECTID": 225,
"SHAPE.LEN": 828.21510830520401
},
"geometry": {
"paths": [
[
[
-99.818614674337155,
27.782542677671653
],
[
-99.816056346719051,
27.782590806976135
]
]
]
}
}
档案B:
"features": [
{
"geometry": {
"type": "MultiLineString",
"coordinates": [
[
[
-99.773315512624,
27.808875128096
],
[
-99.771397939251,
27.809512259374
]
]
]
},
"type": "Feature",
"properties": {
"LTYPE": 64,
"SHAPE.LEN": 662.3800009247,
"NAME": "1586",
"OBJECTID": 204,
"QUAD15M": "279933"
}
},
我希望将文件B重新格式化为文件A. 改变"属性"到"属性","坐标"到"路径",并删除"键入":" MultiLineString"和"键入":"功能"。通过python执行此操作的最佳方法是什么?
有没有办法重新排序"属性"键值对看起来像文件A?
它是一个相当大的数据集,我想迭代整个文件。
答案 0 :(得分:4)
在Python中操作JSON是input-process-output model编程的理想选择。
对于输入,使用json.load()
将外部JSON文件转换为Python数据结构。
对于输出,使用json.dump()
将Python数据结构转换为外部JSON文件。
对于处理或转换步骤,使用普通的Python dict
和list
方法执行您需要执行的任何操作。
这个程序可能会做你想要的:
import json
with open("b.json") as b:
b = json.load(b)
for feature in b["features"]:
feature["attributes"] = feature["properties"]
del feature["properties"]
feature["geometry"]["paths"] = feature["geometry"]["coordinates"]
del feature["geometry"]["coordinates"]
del feature["geometry"]["type"]
del feature["type"]
with open("new-b.json", "w") as new_b:
json.dump(b, new_b, indent=1, separators=(',', ': '))
答案 1 :(得分:-2)
怎么样:
cat <file> | python -m json.tool
这会将文件内容重新格式化为统一的人类可读格式。如果你真的需要改变你可以使用sed的字段名称。
cat <file> | sed -e 's/"properties"/"attributes"/'
这可能足以满足您的使用案例。如果您需要更细致的解析,那么您必须了解如何通过ORM库管理JSON。