我写了一个应用程序,可以帮助我搜索巨大的JSON文件(数据库转储)。使用以下命令将JSON文件作为字典列表加载:
with open ('myDB.json', 'r', encoding="utf-8") as file:
myDB = json.load(file)
myDB的当前结构如下:
[
{
"object":"myobject",
"key1":"value1",
"key2":"value2",
"key3":"value3",
}
{
"object":"myobject",
"key1":"value1",
"key2":"value2",
"key3":"value3",
}
]
有些值是列表,有些值是其他字典,有些只是常规值。
此刻,我正在通过以下方式漂亮地打印查询的项目:
for i in queryResults:
print(json.dumps(i, indent = 3))
...但是可悲的是,每个项目中都有太多按键,以至于在屏幕上占用了太多空间并使其不可读。更糟糕的是,我不需要所有这些。我想做的是选择性地从打印结果中删除某些 key:value 对,所以在我的示例中,我们仅说 object 和 key2 将被打印。
我对手动打印所需的key:value对不感兴趣。这样做的人太多了,更不用说实际需求了。相比之下,我只想删除少数几个 key:value 对。我更希望有一个要删除的键列表,这些键将在打印结果时使用,从而过滤实际打印的内容。
非常欢迎Pythonic一线客。
奖金问题::我主要在寻找一种方法来删除每个项目中的顶级 key:value 对,但是为了全面了解我很高兴也知道如何从作为某些顶级键值的子词典中删除 key:value 对。
答案 0 :(得分:2)
首先:使用pprint
库,就是为此而设计的。
否则,直接的解决方案是过滤字典,然后漂亮地打印它。这样的事情对于顶级密钥删除是有效的
filtered_results = [{k:v for k, v in elem.items() if k not in keys_to_remove} for elem in query_results]
尽管要降低级别,您可能需要做一些递归操作,例如
def filter_results(results, keys_to_remove):
if isinstance(results, list):
return [filter_results(item) for item in list]
elif isinstance(results, dict):
return {k:filter_results(v) for k,v in results.items() if k not in keys_to_remove}
else:
return results
...
filtered_results = filter_results(query_results)
之后,您可以随意打印它
import pprint
...
pprint.pprint(filtered_results)