我想使用此处提供的加泰罗尼亚语词干分析器: http://snowball.tartarus.org/algorithms/catalan/stemmer.html
然而,当我这样做时:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("catalan")
它说:
可以有人帮助我吗?我做错了什么?不支持加泰罗尼亚语
对于西班牙语,当我输入时它会起作用:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("spanish")
非常感谢!
答案 0 :(得分:1)
你没有做错任何事。 SnowballStemmer支持的语言位于源代码中,不包括加泰罗尼亚语:
class SnowballStemmer(StemmerI):
"""
Snowball Stemmer
The following languages are supported:
Danish, Dutch, English, Finnish, French, German,
Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
Spanish and Swedish.