参数allWords包含两列和数千行。第一栏推文。第二个包含一个情绪(0表示负数,4表示正数。
正如底部代码所示,我创建了两个词典(负面和正面),用字母在频率中存储单词。
如果你运行它所显示的代码:
这适用于否定字典{' transit':1,'感染':4,'垃圾邮件':6}
这是针对正面词典{' transit':3,'感染':5,'垃圾邮件':2}
def vectorRepresentation(allWords):
negative = {}
positive = {}
for (t,s) in allWords:
if(s=='0'):
for w in t:
if w in negative:
negative[w]+=1
else:
negative[w]=1
if(s=='4'):
for w in t:
if w in positive:
positive[w]+=1
else:
positive[w]=1
print(negative)
print(positive)
但是,我想创建一个字典并存储同一个键的两个值。例如
newDictionary = {' transit':[1] [3],'感染':[4] [5],'垃圾邮件':[6] [2]}
第一个值代表负数。而第二个值是积极的。怎么能实现呢?
答案 0 :(得分:1)
我打算发表评论,但不能这样做,所以我把它放在答案中:
这里的第一个答案可能会帮助您实现您想要的目标:
append multiple values for one key in Python dictionary
简而言之:您不需要使用数字作为键,也可以使用数组,因此最终得到:
newDictionary = {'transit': [1,3], 'infect': [4,5], 'spam': [6,2]}
答案 1 :(得分:1)
我认为你想要的结构很奇怪而且没有意义,我把它们放在一个列表中:
neg = {'transit': 1, 'infect': 4, 'spam': 6}
pos = {'transit': 3, 'infect': 5, 'spam': 2}
result = {}
for k,v in neg.items():
result[k] = [v,pos[k]]
result # {'spam': [6, 2], 'transit': [1, 3], 'infect': [4, 5]}
答案 2 :(得分:1)
您可以为每个密钥设置值,使其具有negative
和positive
密钥的字典。因此,您修改后的字典将是
{'transit': {'negative': 1, 'positive': 3}}
等等。
或者,您可以创建一个存储负值和正值的小类,并将其作为每个键的值。如果你的班级看起来像:
class NegativePositiveStore:
def __init__(self):
self.negative = 0
self.positive = 0
然后,您的值将成为该对象的单独实例。你可以这样做:
word_dict = {}
for (t,s) in allWords:
for w in t:
if w in word_dict:
if (s == '0'):
word_dict[w].negative += 1
elif (s == '4'):
word_dict[w].positive += 1
else:
word_dict[w] = NegativePositiveStore()
print(word_dict)
答案 3 :(得分:0)
只需保留一对int
作为每个键的值。 defaultdict
将帮助您摆脱一些颠簸:
from collections import defaultdict
def vector_representation(all_words):
neg, pos = 0, 1
neg_pos = defaultdict(lambda: [0, 0]) # store two values for each key
for (t, s) in all_words:
if (s == '0'):
for w in t:
neg_pos[w][neg] += 1
if (s == '4'):
for w in t:
neg_pos[w][pos] += 1
return neg_pos
d = vector_representation(...)
d['transit']
>>> [1, 3]
d['infect']
>>> [4, 5]