我有这段代码:
cursor.execute( ''' SELECT id,DISTINCT tag
FROM userurltag ''')
tags = cursor.fetchall ()
T = [3,5,7,2,1,2,2,2,5,6,3,3,1,7,4]
我有7个组名1,...,7。 “标签”列表中的每一行对应于“T”列表中的一行。“T”的值表示例如“标签”列表中的第一行属于组3,“标签”列表中的第二行属于第5组等。这些基本上是每个标签所属的集群。 我想以一种单独的例如字典数据类型中的每个组/集群的方式提取它们。重要的是,每次运行中集群的数量都会发生变化。所以我需要一个通用代码可以处理这个问题的各种数量的集群。 我真的需要你的帮助 感谢。
答案 0 :(得分:1)
cluster_to_tag = defaultdict(list)
#May want to assert that length of tags and T is same
for tag,cluster in zip(tags, T):
cluster_to_tag[cluster].append(tag)
#cluster_to_tag now maps cluster ti list of tags
HTH