使用Python NLTK进行词干和词形还原,适用于英语和俄语

时间:2018-05-24 11:20:27

标签: python machine-learning nltk stemming

“使用Python NLTK进行词干和词形还原,用于英语和俄语两种语言”

来源:http://text-processing.com/demo/stem/

我希望将lib用于使用Python NLTK用于英语和俄语两种语言。

请您给我一些lib需要用于此任务的建议。

1 个答案:

答案 0 :(得分:1)

对于词干:

NLTK已广泛使用Porter Stemmer

对于俄语,有人似乎使用了Snowball Stemmer

用于词形还原:

我更喜欢SpaCy for lemmatization

对于俄罗斯人来说,有人一直致力于here

可以找到俄语文本的另一个词形变换器here.