用于字数的Python NLTK bigram / trigram逻辑

时间:2017-03-04 19:59:43

标签: python nlp nltk

我对NLP相当新,但我想知道是否有可能nltk检测一组3个单词是否应该有bigram,trigram或者两个逻辑都没有应用?

基本上我要做的是创建一个程序,在大文本文件上提供短语/单词计数。我可以使用bigram / trigram获得单字数,两个单词短语计数和三个单词短语计数,但我希望将3结合起来,这样我就可以创建一个包含单个单词,两个单词短语和三个单词的单词云短语。该程序必须有一些方法可以智能地猜测是否应将一组3个单词作为单个单词,两个单词或3个单词返回并进行相应计数。 nltk可以做点什么吗?不太确定我会怎么做。

提前感谢您提供的任何帮助。

0 个答案:

没有答案