我正在试图弄清楚如何找到一个名为['text']的键,然后从嵌套中获取父键。它是第三个不同的键,所有其他标签都是相同的。
html_data = data['data']['document_data']['dataItem-ihmty5rw']['text']
我正在使用此功能获取密钥:
def printKeysValues(d):
for k, v in d.items():
if isinstance(v, dict):
printKeysValues(v)
else:
print("{0} : {1}".format(k, v))
这个函数找到缩进:
def pretty(d, indent=0):
for key, value in d.items():
print('\t' * indent + str(key))
if isinstance(value, dict):
pretty(value, indent+1)
else:
print('\t' * (indent+1) + str(value))
答案 0 :(得分:0)
我仍然不完全确定这是否是您想要的,但如果您只想要每个项目字典的文本,我认为这应该有效:
# a dictionary of item string to dictionary containing a "text" key
item_map = data['data']['document_data']
for item_string, item_map in item_map.iteritems():
print item_string # the item string (e.g. 'dataItem-ihmty5rw')
print item_map['text'] # this is the text associated with the item string