执行Logstash聚合后,我收到此JSON对象响应。
"aggregations": {
"range": {
"buckets": [
{
"key": "2018-01-01T00:00:00.000Z-2018-01-31T00:00:00.000Z",
"from_as_string": "2018-01-01T00:00:00.000Z",
"to_as_string": "2018-01-31T00:00:00.000Z",
"doc_count": 13000,
"by ip": {
"doc_count_error_upper_bound": 10,
"sum_other_doc_count": 10300,
"buckets": [
{
"key": "192.168.0.1",
"doc_count": 20 <---
.
.
. (Sub-buckets for other fields containing doc_count as
well)
},
{
"key": "1.2.3.4",
"doc_count": 50 <---
}
}
]
}
}
]
}
}
我想将“ doc_count”键重命名为“唯一事件数”。但是,我只希望这仅用于IP地址存储段的doc_count,而不是其他任何存储段字段。
这是我找到的解决方案之一,但是它为每个字段存储区重命名了doc_count。
def rename_doc_count(obj):
for key in obj.keys():
new_key = key.replace("doc_count","Number of unique events")
if new_key != key:
obj[new_key] = obj[key]
del obj[key]
return obj
new_json = json.loads(jres, object_hook=rename_doc_count)
任何人都有适合我情况的解决方案吗?谢谢!
答案 0 :(得分:1)
在加载JSON之后执行此操作,因此您可以仅在所需的元素上调用该函数。
obj = json.loads(jres);
for bucket in obj["aggregations"]["range"]["buckets"]:
for bucket2 in bucket["by ip"]["buckets"]:
rename_doc_count(bucket2)
rename_doc_count
中不需要循环,只需获取特定的字典元素即可。
def rename_doc_count(obj):
if "doc_count" in obj:
obj["Number of unique events"] = obj["doc_count"]
del obj["doc_count"]
您提到,可能有一些子存储桶也应重命名。您可以通过rename_doc_count
递归调用自身来实现。但是您没有显示它们在结构中的位置,因此我不确切知道它的外观。但这类似于json.loads()
之后的循环。