Question

以下代码是为每个句子获取文档的示例代码。

Get docs

要获取每个单词属性，我们使用的是文档，示例代码如下所示。

Get Tokens

通过深入研究spacy代码，我可以弄清楚每个名词都有与之相关的形态学。

从此spacy的源代码中查看ID（字典）的值：click here

我的问题：

我无法获取每个名词标记的形态值。我怎么能得到相同的...？

Answer 1

我不确定您的选择，但听起来您正在询问如何获取每个令牌的形态属性。可以像这样查找令牌的形态属性：

>>> nlp = spacy.load('en')
>>> doc = nlp('Dogs are friendly.')
>>> token = doc[0]  # Dogs
>>> nlp.vocab.morphology.tag_map[token.tag_]
{74: 91, 'Number': 'plur'}
>>>

获取spacy解析器创建的每个令牌的Spacy.Vocab.Morphology ids

1 个答案: