标签: python nltk
我正在制作文件,需要将那些与那些没有的文字区分开来。 NLTK词干提取方法都返回没有词干的单词的输入。
stemmer.stem('running')#word有一个词根 运行 stemmer.stem('run')#word stem是单词本身 运行 stemmer.stem('asdf')#word是胡说八道 ASDF
我需要分辨后一种情况。是否有一个词干分析器返回两个结果(词干和找到的指示符)或一个有效的词干列表?