如何在spacy中使用引理获取adj或副词的基本形式

时间:2019-05-18 12:27:53

标签: python spacy lemmatization

对于一个项目,如果有使用NLP的名词,我希望能够获得形容词或副词的名词形式。 例如,“死亡”将返回“死亡”,“死亡”将返回“死亡”。 “活泼”将返回“生命”。

我尝试使用spacy lemmatizer,但无法获得基本的激进形式。 例如,如果我愿意:

Accounting/download

它将返回: import spacy nlp = spacy.load('en_core_web_sm') z = nlp("deathly lively") for token in z: print(token.lemma_) 代替: >>> deathly lively

有人有什么想法吗? 任何答案表示赞赏。

1 个答案:

答案 0 :(得分:0)

从我到目前为止所看到的情况来看,SpaCy在做自己想要做的事情上并不是很棒。相反,我使用的是一个名为pyinflect的第三方库,该库旨在用作SpaCy的扩展。

虽然它并不完美,但我认为它会比您当前的方法更好。

我还在考虑另一个名为inflect的第三方库,这也许也值得一试。