我正在尝试使用spaCy
训练NER模型来识别位置,(人)名称和组织。我试图了解spaCy
如何识别文本中的实体,但我无法找到答案。来自Github上的this issue和this example,似乎spaCy使用文本中存在的许多功能,例如POS标签,前缀,后缀以及文本中的其他字符和基于单词的功能来训练平均感知器。
但是,代码中没有任何地方spaCy
使用GLoVe嵌入(尽管句子/文档中的每个单词都有它们,如果存在于GLoVe语料库中)。
我的问题是 -
spaCy
如何使用单词向量?我已经尝试了查看Cython代码,但我无法理解标签系统是否使用了字嵌入。