我有40个标签,我用它们制作了bigrams。我想要一本字典,其中包含其他字母和字母的概率。像这样的东西:
dict={'tag1' : {'tag1': 0.7, 'tag2': 0.3},
'tag2' : {'tag1': 0.4, 'tag2': 0.6}
}
我编写了一个代码,用于计算bigrams的概率并将它们放入字典中,以及一个将它们分配给另一个字典的循环。但问题只是最后一个二元组,它的概率将被分配。我的意思是循环没有得到更新。请告诉我这似乎是什么问题? 这是我的代码:
each_state_bi_prob={}
transition_probability={}
for i in bi_TAGS:
if i in bi_states:
prob_bi_states=bi_states.count(i)/states.count(i[1])
each_state_bi_prob[i]=prob_bi_states
else:
prob_bi_states=0.0001
each_state_bi_prob[i]=prob_bi_states
for i in TAGS:
for k,v in each_state_bi_prob.items():
if k[0]==i:
transition_probability[i]={k[1]:v}