获取spacy解析器创建的每个令牌的Spacy.Vocab.Morphology ids

时间:2016-09-05 12:05:45

标签: python nlp cython spacy pos-tagger

以下代码是为每个句子获取文档的示例代码。

Get docs

要获取每个单词属性,我们使用的是文档,示例代码如下所示。

Get Tokens

通过深入研究spacy代码,我可以弄清楚每个名词都有与之相关的形态学。

从此spacy的源代码中查看ID(字典)的值:click here

我的问题:

我无法获取每个名词标记的形态值。我怎么能得到相同的...?

1 个答案:

答案 0 :(得分:2)

我不确定您的选择,但听起来您正在询问如何获取每个令牌的形态属性。可以像这样查找令牌的形态属性:

>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0]  # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>>