用Textblob-de使德语文本合法化

时间:2019-06-25 09:18:11

标签: python lemmatization textblob

Textblob-de是Textblob的德语扩展,记录在https://textblob-de.readthedocs.io/en/latest/#

我想对诸如hast-> haben,Häuser-> Haus with Textblob-de的德语单词进行词素化

我从J. Schneider找到了有关Python中不同的词形化方法的帖子,该方法是为英语量身定制的,其中还包括有关Textblob(英语版)的部分:https://www.machinelearningplus.com/nlp/lemmatization-examples-python/

我想知道在德语扩展中是否也有进行词法化的可能性。

在J. Schneider的文字之后,可以通过以下几行进行残词化

from textblob_de import TextBlobDE, Word
word = 'hast Häuser'
w = Word(word)
w.lemmatize()

我收到以下NotImplementedError:

NotImplementedError                       Traceback (most recent call last)
<ipython-input-5-16cfb68c1c58> in <module>
      2 word = 'hast Häuser'
      3 w = Word(word)
----> 4 w.lemmatize()

/anaconda3/lib/python3.7/site-packages/textblob/decorators.py in decorated(*args, **kwargs)
     33     def decorated(*args, **kwargs):
     34         try:
---> 35             return func(*args, **kwargs)
     36         except LookupError as err:
     37             print(err)

/anaconda3/lib/python3.7/site-packages/textblob_de/blob.py in lemmatize(self, pos)
    161         #lemmatizer = nltk.stem.WordNetLemmatizer()
    162         # return lemmatizer.lemmatize(self.string, pos)
--> 163         raise NotImplementedError
    164 
    165     @cached_property

NotImplementedError: 

我希望输出如下:

haben Haus

1 个答案:

答案 0 :(得分:0)

尝试以下代码:

from textblob_de import TextBlobDE

word = 'hast Häuser'
w = TextBlobDE(word)
print(w.words.lemmatize())

输出:

['hast', 'Häuser']

有关TextBlob的德语支持的更多信息,请选中this