我有一个像下面这样的字典,例如,对于第一个项目,意味着5是2的客户。在最后一个项目中,如您所见,2是4的客户,而4也是该项目的客户3。
customer_provider_dic= {'2':['5'],'1':['2'],'3':['4'],'4':['2']}
我正在尝试提取这些项目的所有客户链。输出将如下所示:
[2,5]
[1,2,5]
[3,4,2,5]
[4,2,5]
我真的很困惑如何提取这些链。关于流程图或步骤的任何建议。
答案 0 :(得分:0)
首先,如果所有列表仅包含一个项目,那么这是一种解决方案。
def simple_chain(graph, key):
chain = [key]
while True:
lst = graph.get(key)
if lst is None:
# There's nothing left to add to the chain
break
key = lst[0]
if key in chain:
# We've found a loop
break
chain.append(key)
return chain
customer_provider = {
'2': ['5'], '1': ['2'], '3': ['4'], '4': ['2'],
}
data = customer_provider
for k in data:
print(simple_chain(data, k))
输出
['2', '5']
['1', '2', '5']
['3', '4', '2', '5']
['4', '2', '5']
一般的解决方案要难一些。我们可以使用递归生成器创建所有链。下面的代码可以工作,但是效率不高,因为它多次创建相同的子链。
基本策略与以前的版本相似,但是我们需要遍历每个列表中的所有键,并为每个列表创建新的链。
要完全了解此代码的工作方式,您需要熟悉recursion和Python generators。您可能还会发现此页面有帮助:Understanding Generators in Python;在线上也有各种Python生成器教程。
def make_chains(graph, key, chain):
''' Generate all chains in graph that start at key.
Stop a chain when graph[key] doesn't exist, or if
a loop is encountered.
'''
lst = graph.get(key)
if lst is None:
yield chain
return
for k in lst:
if k in chain:
# End this chain here because there's a loop
yield chain
else:
# Add k to the end of this chain and
# recurse to continue the chain
yield from make_chains(graph, k, chain + [k])
customer_provider = {
'2': ['5'], '1': ['2'], '3': ['4'], '4': ['2'],
}
pm_data = {
'2': ['5'], '1': ['2'], '3': ['4', '6'],
'4': ['2'], '6': ['1', '5'],
}
#data = customer_provider
data = pm_data
for k in data:
for chain in make_chains(data, k, [k]):
print(chain)
如果我们使用data = customer_provider
运行该代码,它将产生与先前版本相同的输出。这是使用data = pm_data
运行时的输出。
['2', '5']
['1', '2', '5']
['3', '4', '2', '5']
['3', '6', '1', '2', '5']
['3', '6', '5']
['4', '2', '5']
['6', '1', '2', '5']
['6', '5']
yield from
语法是Python 3的功能。要在Python 2上运行此代码,请更改
yield from make_chains(graph, k, chain + [k])
到
for ch in make_chains(graph, k, chain + [k]):
yield ch
在Python 3.6之前,dict
不会保留键的插入顺序,因此for k in data
可以任何顺序遍历data
的键。输出列表仍然是正确的。您可能希望将该循环替换为
for k in sorted(data):
按顺序获取链条。