Question

我有一本字典，我想将其用作模板，以使用更新的字典项生成多个字典。在pytest的单元测试中，此列表应用作测试目的的数据集。

我在代码中使用以下构造（不包括检查项）：

def _f(template,**kwargs):
    result = [template]
    for key, value in kwargs.items():
        result = [dict(template_item,**dict([(key,v)])) for v in value for template_item in result]
    return result

template = {'a': '', 'b': '', 'x': 'asdf'}

r = _f(template, a=[1,2],b=[11,22])

pprint(r)

[{'a': 1, 'b': 11, 'x': 'asdf'},
 {'a': 2, 'b': 11, 'x': 'asdf'},
 {'a': 1, 'b': 22, 'x': 'asdf'},
 {'a': 2, 'b': 22, 'x': 'asdf'}]

我想问一下该结构是否足以构建良好的结构-可能可以更高效地编写它。

这是准备测试数据的正确方法吗？

编辑： 特别是我不确定

[dict(template_item,**dict([(key,v)])) for v in value for template_item in result]

和

dict(template_item,**dict([(key,v)]))

在我考虑dict.update（）之前，但由于它不返回字典，因此不适合理解。

然后我在考虑像这样的简单语法

d = {'aa': 11, 'bb': 22}
dict(d,x=33,y=44)
    {'aa': 11, 'bb': 22, 'x': 33, 'y': 44}

但是我无法通过变量传递键值。而且创建dict只是为了解开包装对我来说适得其反。

Answer 1

特别是我不确定...

在理解中更新Python字典的事情有点复杂，因为它们是可变的。在Why doesn't a python dict.update() return the object?中，最佳答案建议您当前的解决方案。我个人可能会在此处使用常规的for循环，以确保代码清晰易读。

这是准备测试数据的正确方法吗？

通常在单元测试中，您将同时测试边缘情况和常规情况（不过，您不想重复自己）。您通常希望拆分测试，以便每个测试都有其自己的名称，以解释为什么存在该测试，以及可能还有一些其他数据，这些数据可以帮助某些局外人了解确保这种情况正确运行的重要性。将所有场景放到一个列表中，然后针对每个场景进行测试，而又不给读者其他上下文（至少以测试用例名称的形式），使读者更难区分案例并判断它们是否全部真的需要。
有时将每个方案放在一个单独的测试用例中似乎有些乏味，但是如果任何测试失败，则可以立即判断出软件的哪一部分失败了。如果您觉得自己编写了太多的单元测试，那么也许其中一些涵盖了相同的场景。
在进行单元测试时，性能很少是首要任务。通常，更重要的是使测试次数最少，但足以确保软件正确运行。另一个优先事项是使测试易于理解。有关此问题的另一观点，请参见下文（不一定是性能更高，但希望更清晰易懂）。

替代解决方案

您可以使用itertools.product来简化代码。可以删除template参数（因为您可以在**kwargs中传递模板变量名称及其可能的值）：

from pprint import pprint
import itertools

def _f(**kwargs):
    keys, values = zip(*(kwargs.items())) # 1.
    subsets = [subset for subset in itertools.product(*values)] # 2.
    return [
        {key: value for key, value in zip(keys, subset)} for subset in subsets
    ] # 3.

r = _f(a=[1, 2], b=[11, 22], x=['asdf'])
pprint(r)

现在每个步骤都发生了什么：

步骤1。您将关键字dict分为键和值。这很重要，因此您将确定每次迭代这些参数的顺序。此时的键和值如下所示：

keys = ('a', 'b', 'x') 
values = ([1, 2], [11, 22], ['asdf'])

步骤2。您计算值的笛卡尔积，这意味着您从每个values列表中获取一个值的所有可能组合。该操作的结果如下：

subsets = [(1, 11, 'asdf'), (1, 22, 'asdf'), (2, 11, 'asdf'), (2, 22, 'asdf')]

第3步。现在，您需要将每个键映射到每个子集中的相应值，因此列表和字典的理解应该与您使用先前方法计算的结果完全相同：

[{'a': 1, 'b': 11, 'x': 'asdf'},
 {'a': 1, 'b': 22, 'x': 'asdf'},
 {'a': 2, 'b': 11, 'x': 'asdf'},
 {'a': 2, 'b': 22, 'x': 'asdf'}]

通过理解更新列表中的词典项目

1 个答案:

替代解决方案