如何从变形的形式以编程方式获得单词的基本形式?

时间:2018-07-26 20:32:28

标签: python nlp natural-language-processing

我想找到python中输入单词的基本形式

类似

get_base_form({running, best, eyes, moody})
--> run, good, eye, mood

只处理常规格式的解决方案就可以了。但是,还可以解决不规则问题的答案将是完美的。

如果没有执行此操作的库,那么也可以使用Web服务。

1 个答案:

答案 0 :(得分:1)

使用nltk自然语言工具包中的SnowballStemmer:

from nltk.stem.snowball import SnowballStemmer

stemmer = SnowballStemmer("english")
print(stemmer.stem("generalized"))
print(stemmer.stem("generalization"))

输出:

general
general

顺便说一句,您可以在https://www.nltk.org/上阅读nltk的文件记录