spacy库中的Python NLP依赖解析器运行不正常

时间:2017-03-27 12:32:28

标签: python nlp spacy

当我给spacy解析器这句话:“一个男人一直走在街上”,它说'已经'是根,而走路是xcompl,就像'走路'会在句子中:“一个男人喜欢走在街上“。这是错的。

现在,这不会发生在替代(https://demos.explosion.ai/displacy/?text=a%20man%20has%20been%20walking%20in%20the%20street&model=en&cpu=0&cph=0)。 有谁知道如何下载displacy使用的模型版本?我非常感激。

1 个答案:

答案 0 :(得分:0)

是的,这可能是因为pip安装Spacy和使用替代品的型号不同。

>>> import spacy
>>> nlp = spacy.load('en')
>>> parsed = nlp("a man has been walking in the street")
>>> [(x.text,x.dep_,x.pos) for x in parsed]
[(u'a', u'det', 88), (u'man', u'nsubj', 90), (u'has', u'aux', 98), (u'been', u'ROOT', 98), (u'walking', u'xcomp', 98), (u'in', u'prep', 83), (u'the', u'det', 88), (u'street', u'pobj', 90)]
>>> nlp.meta
{u'lang': u'en', u'name': u'core_web_sm', u'license': u'CC BY-SA 3.0', u'author': u'Explosion AI', u'url': u'https://explosion.ai', u'version': u'1.2.0', u'spacy_version': u'>=1.7.0,<2.0.0', u'email': u'contact@explosion.ai', u'description': u'Small English model for spaCy. Includes vocabulary, syntax, entities and word vectors (GloVe).'}

移民模式可能来自此处列出的更广泛的模型之一:

https://github.com/explosion/spacy-models

core_web_sm是轻量级的,替代可能是使用en_core_web_md