如何使用雪球的加泰罗尼亚限制器?

时间:2016-03-11 18:02:34

标签: python nltk snowball

我想使用此处提供的加泰罗尼亚语词干分析器: http://snowball.tartarus.org/algorithms/catalan/stemmer.html

然而,当我这样做时:

from nltk.stem.snowball import SnowballStemmer   
stemmer = SnowballStemmer("catalan")

它说:

  

不支持加泰罗尼亚语

可以有人帮助我吗?我做错了什么?

对于西班牙语,当我输入时它会起作用:

from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("spanish")

非常感谢!

1 个答案:

答案 0 :(得分:1)

你没有做错任何事。 SnowballStemmer支持的语言位于源代码中,不包括加泰罗尼亚语:

class SnowballStemmer(StemmerI):

    """
    Snowball Stemmer

    The following languages are supported:
    Danish, Dutch, English, Finnish, French, German,
    Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
    Spanish and Swedish.

在此处找到:http://www.nltk.org/_modules/nltk/stem/snowball.html