用python中的bigrams计算概率

时间:2020-07-03 08:21:06

标签: python nltk


我用文本制作了双字母组,现在我想用它来计算概率。 我的二元组代码如下:
from nltk import ngrams
n = 2
test = training["review_clean"][0].split()

bigram = list(ngrams(test,n))
for gram in bigram:
    print(gram)

输出看起来像这样:

[(die,studiengangsgross),(studiengangsgross,学士),(bachelor, ca),(ca,6070),(6070,学生),...]

那么有人知道如何在这里进行近似匹配吗?
预先感谢!

0 个答案:

没有答案