用于Python中两组单词的翻译概率的最佳数据结构

时间:2015-04-03 09:38:25

标签: python dictionary matrix nested nlp

我建立概率p(e | f),即英语单词e是外语单词f的翻译。我正在使用IBM模型1。

我可以在Python中使用哪种数据结构?我是一个完整的Python初学者,但我可以非常熟练地编程。我想我正在寻找类似嵌套字典或带有命名列和行的矩阵。

1 个答案:

答案 0 :(得分:0)

您可以在字典中使用字典:

dict = {e1: {f1: p1, f2:p2, ...}, e2: {f1: p3, f2: p4, ...}, ...}

或者你可以使用一个普通的字典,它使用e和f的串联作为键,概率作为值:

dict = {(e1+f1): p1,(e1+f2): p2, ...}