Python:存储与字典中的键相关联的列表值

时间:2010-09-12 06:55:37

标签: python information-retrieval

我知道python词典如何存储键:值元组。在我正在进行的项目中,我需要存储与列表值相关联的密钥。 例如: 键 - > [0,2,4,5,8] 哪里, key是来自文本文件的单词 列表值包含代表单词出现的DocID的整数。

当我在另一个文档中找到相同的单词时,我需要将该DocID附加到列表中。

我怎样才能做到这一点?

6 个答案:

答案 0 :(得分:6)

您可以使用defauldict,如下所示:

>>> import collections
>>> d = collections.defaultdict(list)
>>> d['foo'].append(9)
>>> d
defaultdict(<type 'list'>, {'foo': [9]})
>>> d['foo'].append(90)
>>> d
defaultdict(<type 'list'>, {'foo': [9, 90]})
>>> d['bar'].append(5)
>>> d
defaultdict(<type 'list'>, {'foo': [9, 90], 'bar': [5]})

答案 1 :(得分:1)

这是一个使用defaultdict

的好地方
from collections import defaultdict

docWords = defaultdict(set)
for docID in allTheDocIDs:
    for word in wordsOfDoc(docID):
        docWords[word].add(docID)

如果必须

,您可以使用列表而不是集合

答案 2 :(得分:1)

这篇文章对我有助于解决我在动态创建附加数据列表的变量键时遇到的问题。见下文:

import collections

d = collections.defaultdict(list)
b = collections.defaultdict(list)
data_tables = ['nodule_data_4mm_or_less_counts','nodule_data_4to6mm_counts','nodule_data_6to8mm_counts','nodule_data_8mm_or_greater_counts']

for i in data_tables:
    data_graph = con.execute("""SELECT ACC_Count, COUNT(Accession) AS count
                                            FROM %s
                                            GROUP BY ACC_Count"""%i)
    rows = data_graph.fetchall()
    for row in rows:
        d[i].append(row[0])
        b[i].append(row[1])

print d['nodule_data_4mm_or_less_counts']
print b['nodule_data_4mm_or_less_counts']

哪个输出每个键的数据列表,然后可以更改为np.array以进行绘图等。

>>>[4201, 1052, 418, 196, 108, 46, 23, 12, 11, 8, 7, 2, 1]
>>>[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16]

答案 3 :(得分:0)

这样的东西?


word = 'something'
l = [0,2,4,5,8]
myDict = {}
myDict[word] = l

#Parse some more

myDict[word].append(DocID)

答案 4 :(得分:0)

我曾写过一个帮助类,让@Vinko Vrsalovic的answer更容易使用:

class listdict(defaultdict):
    def __init__(self):
        defaultdict.__init__(self, list)

    def update(self, E=None, **F):
        if not E is None:
            try:
                for k in E.keys():
                    self[k].append(E[k])
            except AttributeError:
                for (k, v) in E:
                    self[k].append(v)
        for k in F:
            self[k].append(F[k])

可以这样使用:

>>> foo = listdict()
>>> foo[1]
[]
>>> foo.update([(1, "a"), (1, "b"), (2, "a")])
>>> foo
defaultdict(<type 'list'>, {1: ['a', 'b'], 2: ['a']})

答案 5 :(得分:-1)

如果我的问题是对的,你可以尝试一下,

           >>> a=({'a':1,'b':2});
           >>> print a['a']
            1
           >>> a.update({'a':3})
           >>> print a['a']
            3
            >>> a.update({'c':4})
            >>> print a['c']
             4

这适用于旧版本的python