从Python中的单独列表中提取和集成数据

时间:2010-05-21 16:30:41

标签: python list cluster-analysis

我有这段代码:

cursor.execute( ''' SELECT id,DISTINCT tag
                     FROM userurltag ''')
tags = cursor.fetchall ()
T = [3,5,7,2,1,2,2,2,5,6,3,3,1,7,4] 

我有7个组名1,...,7。 “标签”列表中的每一行对应于“T”列表中的一行。“T”的值表示例如“标签”列表中的第一行属于组3,“标签”列表中的第二行属于第5组等。这些基本上是每个标签所属的集群。 我想以一种单独的例如字典数据类型中的每个组/集群的方式提取它们。重要的是,每次运行中集群的数量都会发生变化。所以我需要一个通用代码可以处理这个问题的各种数量的集群。 我真的需要你的帮助 感谢。

1 个答案:

答案 0 :(得分:1)

cluster_to_tag = defaultdict(list)
#May want to assert that length of tags and T is same
for tag,cluster in zip(tags, T):
    cluster_to_tag[cluster].append(tag)

#cluster_to_tag now maps cluster ti list of tags

HTH