Question

我有一本价值词典：

dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v", ...}

我在Flask中有一个页面，其中包含字典中每个部分字符串值的复选框，例如复选框“a”，“b”，“c”，...等。在页面上，复选框位于组a1，a2，a3等中。

我需要根据所选复选框的值按部分值过滤字典，例如，当在组a1中选择“c”时，它将返回：

 1: a1+b+c
 2: a1+c+v

从组a2中选择“z”时，它将返回：

 5: "a2+z+v"

生成错误的代码是：

sol = [k for k in dic if 'a1' in k]

有人能指出我正确的方向吗？

Answer 1

您可以使用非常短的功能轻松解决此问题：

def lookup(dct, *args):
    for needle in args:
        dct = {key: value for key, value in dct.items() if needle in value}
    return dct

例如：

>>> dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v"}
>>> lookup(dic, "a1", "c")
{1: 'a1+b+c', 2: 'a1+c+v'}

然而，总是需要迭代每个＆＃34;针＆＃34;的所有键。如果你有一个帮助字典（我会在这里使用collections.defaultdict）存储所有匹配一个针的键（假设+应该是你字典中的分隔符），你可以做得更好：

from collections import defaultdict

helperdict = defaultdict(set)
for key, value in dic.items():
    for needle in value.split('+'):
        helperdict[needle].add(key)

helperdict现在包含与值的某个特定部分匹配的所有键：

>>> print(dict(helperdict))
{'z': {3, 5}, 'p': {4}, 'a1': {1, 2, 3}, 'a3': {6}, 'v': {2, 5, 6}, 'a2': {4, 5}, 'e': {3}, 'b': {1}, 'a': {4}, 'c': {1, 2}, 'q': {6}}

使用set.intersection可以快速获得不同组合的所有匹配项：

>>> search = ['a2', 'z']
>>> matches = set.intersection(*[helperdict[needle] for needle in search])
>>> {match: dic[match] for match in matches}
{5: 'a2+z+v'}

它肯定比第一种方法更长，需要更多的外部存储器，但如果你计划进行多次查询，它会更快。

如何根据部分字符串匹配过滤字典？

1 个答案: