我一直试图找出连续两天的替代品,而且找不到任何相关的东西。 我基本上试图获得合成句子的概率分数(通过替换从语料库中挑选的原始句子中的一些单词来合成)。
我尝试过搭配,但我得到的分数并不是很有帮助。所以我尝试使用语言模型概念,却发现看似有用的模块'模型'由于一些错误,已从NLTK中删除。
如果有人能让我知道一些在python中获得ngram模型实现的替代方法,那真是太棒了,或者更好的是,建议我用其他方法来解决&得分问题#39;这句话。
答案 0 :(得分:15)
根据this open issue on the nltk repo,由于存在一些错误,NGramModel
目前尚未掌握。他们目前的解决方案是从模型分支安装代码。这比大师晚了大约8个月,所以你可能会错过其他功能和错误修复。
pip install https://github.com/nltk/nltk/tarball/model
相关代码为here in the model branch。如果您不想使用过时的分支,可以将其复制到本地代码。如果您真的关心使用此功能,可以尝试修复the outstanding bugs并提交拉取请求。