标签: python machine-learning nltk stemming
来源:http://text-processing.com/demo/stem/
我希望将lib用于使用Python NLTK用于英语和俄语两种语言。
请您给我一些lib需要用于此任务的建议。
答案 0 :(得分:1)
对于词干:
NLTK已广泛使用Porter Stemmer。
对于俄语,有人似乎使用了Snowball Stemmer。
用于词形还原:
我更喜欢SpaCy for lemmatization。
对于俄罗斯人来说,有人一直致力于here。
可以找到俄语文本的另一个词形变换器here.