使用glom将字典列表的字段提取到新字典中

时间:2019-08-13 14:01:47

标签: python glom

我具有以下高度简化的结构

elements = [{"id": "1", "counts": [1, 2, 3]},
            {"id": "2", "counts": [4, 5, 6]}]

我希望能够使用glom构建{<id>: <counts[pos]>}形式的新字典,例如为pos = 2

{"1": 3, "2": 6}

或者是元组列表/元组

[("1",3), ("2", 6)]

使用dict comprehension很容易,但是数据结构更加复杂,我想动态指定要提取的内容。上一个示例是我想实现的最简单的方法。

一段时间后,我设法解决了以下问题

from glom import glom, T

elements = [{"id": "1", "counts": [1,2,3]},{"id": "2", "counts": [4,5,6]}]

def extract(elements, pos):
    extracted = glom(elements, ({"elements": [lambda v: (v["id"], v["counts"][pos])]}, T))
    return dict(extracted["elements"])

但这需要调用dict。跳过字典间接访问的轻微变化是

def extract(elements, pos):
    extracted = glom(elements, (([lambda v: {v["id"]: v["counts"][pos]}]), T))
    return {k: v for d in extracted for k, v in d.items()}

现在,我可以使用merge函数调用的glom函数

def extract(elements, pos):
    return merge(glom(elements, (([lambda v: {v["id"]: v["counts"][pos]}]), T)))

我对此很满意,但是有更好的方法吗?我所说的更好意味着建立一个可调用的更清洁的规格?最终,我希望能够在运行时以用户友好的方式定义字典的值,即v["counts"][pos]

对此想法的改进是使用可调用对象作为内部字典的值

def counts_position(element, **kwargs):
    return element["counts"][kwargs["pos"]]

def extract(elements, func, **kwargs):
    return merge(glom(elements, (([lambda v: {v["id"]: func(v, **kwargs)}]), T)))

extract(values, counts_position, pos=2)

这样,可以从外部控制从每个元素开始提取的内容。

1 个答案:

答案 0 :(得分:3)

要将每个中带有id的字典列表转换为ID字典,您可以使用简单的字典理解:

{t["id"]: glom.glom(t, "counts.2") for t in elements}

或者,如果您想为此使用glom,use glom.Merge along with glom.T

glom.glom(elements, glom.Merge([{T['id']: 'counts.2'}])))

为避免使用lambda,您可以将pos参数插值到规范字符串中,例如'counts.%s' % pos