如何在python中存储一个键的多个值

时间:2016-03-07 20:44:56

标签: python python-2.7 python-3.x nltk text-classification

参数allWords包含两列和数千行。第一栏推文。第二个包含一个情绪(0表示负数,4表示正数。

正如底部代码所示,我创建了两个词典(负面和正面),用字母在频率中存储单词。

如果你运行它所显示的代码:

这适用于否定字典{' transit':1,'感染':4,'垃圾邮件':6}

这是针对正面词典{' transit':3,'感染':5,'垃圾邮件':2}

   def vectorRepresentation(allWords):       
    negative = {}
    positive = {}

    for (t,s) in allWords:
        if(s=='0'):
            for w in t:
                if w in negative:
                    negative[w]+=1
                else:
                    negative[w]=1
        if(s=='4'):
            for w in t:
                if w in positive:
                    positive[w]+=1
                else:
                    positive[w]=1
     print(negative)
     print(positive)

但是,我想创建一个字典并存储同一个键的两个值。例如

newDictionary = {' transit':[1] [3],'感染':[4] [5],'垃圾邮件':[6] [2]}

第一个值代表负数。而第二个值是积极的。怎么能实现呢?

4 个答案:

答案 0 :(得分:1)

我打算发表评论,但不能这样做,所以我把它放在答案中:

这里的第一个答案可能会帮助您实现您想要的目标:

append multiple values for one key in Python dictionary

简而言之:您不需要使用数字作为键,也可以使用数组,因此最终得到:

 newDictionary = {'transit': [1,3], 'infect': [4,5], 'spam': [6,2]}

答案 1 :(得分:1)

我认为你想要的结构很奇怪而且没有意义,我把它们放在一个列表中:

neg = {'transit': 1, 'infect': 4, 'spam': 6}
pos =  {'transit': 3, 'infect': 5, 'spam': 2}
result = {}
for k,v in neg.items():
    result[k] = [v,pos[k]]
result # {'spam': [6, 2], 'transit': [1, 3], 'infect': [4, 5]}

答案 2 :(得分:1)

您可以为每个密钥设置值,使其具有negativepositive密钥的字典。因此,您修改后的字典将是

{'transit': {'negative': 1, 'positive': 3}} 

等等。

或者,您可以创建一个存储负值和正值的小类,并将其作为每个键的值。如果你的班级看起来像:

class NegativePositiveStore:
    def __init__(self):
        self.negative = 0
        self.positive = 0

然后,您的值将成为该对象的单独实例。你可以这样做:

word_dict = {}
for (t,s) in allWords:
    for w in t:
        if w in word_dict:
            if (s == '0'):
                word_dict[w].negative += 1
            elif (s == '4'):
                word_dict[w].positive += 1
        else:
            word_dict[w] = NegativePositiveStore()

print(word_dict)

答案 3 :(得分:0)

只需保留一对int作为每个键的值。 defaultdict将帮助您摆脱一些颠簸:

from collections import defaultdict

def vector_representation(all_words):
    neg, pos = 0, 1
    neg_pos = defaultdict(lambda: [0, 0])  # store two values for each key

    for (t, s) in all_words:
        if (s == '0'):
            for w in t:
                neg_pos[w][neg] += 1
        if (s == '4'):
            for w in t:
                neg_pos[w][pos] += 1
    return neg_pos

d = vector_representation(...)

d['transit']
>>> [1, 3] 

d['infect']
>>> [4, 5]