很明显,那里有很多文字词典,但是每个词都没有加权。
我想要一个英文字典文本文件,不知何故对每个单词都有一个权重,即单词受欢迎程度(实际上通过任何人气定义都可以 - 谷歌上的实例,书中的实例等)。 / p>
有人知道那里有什么吗?
答案 0 :(得分:2)
google n-grams符合您的要求。这是一个(巨大的)n-gram列表及其出现次数,并且是公开的。
uni-gram - single words
bi-grams - all pairs of 'word1 word2'
...