Question

我有这段代码：

cursor.execute( ''' SELECT id,DISTINCT tag
                     FROM userurltag ''')
tags = cursor.fetchall ()
T = [3,5,7,2,1,2,2,2,5,6,3,3,1,7,4]

我有7个组名1，...，7。 “标签”列表中的每一行对应于“T”列表中的一行。“T”的值表示例如“标签”列表中的第一行属于组3，“标签”列表中的第二行属于第5组等。这些基本上是每个标签所属的集群。我想以一种单独的例如字典数据类型中的每个组/集群的方式提取它们。重要的是，每次运行中集群的数量都会发生变化。所以我需要一个通用代码可以处理这个问题的各种数量的集群。我真的需要你的帮助感谢。

Answer 1

cluster_to_tag = defaultdict(list)
#May want to assert that length of tags and T is same
for tag,cluster in zip(tags, T):
    cluster_to_tag[cluster].append(tag)

#cluster_to_tag now maps cluster ti list of tags

HTH

从Python中的单独列表中提取和集成数据

1 个答案: