我成功地训练了Spacy识别一些自定义命名实体。
让我们说该模型成功地识别了公司(ORG)和水果(FRUIT)。
我想获得一个单词成为每个实体的概率。像这样:
doc = nlp("Apple to ship highest number of new iPhones this fall")
print(getProbabilities(doc))
// [
// (0,0, 'Apple', [ ['ORG', 0.99], ['FRUIT', 0.01] ])
// ]
doc = nlp("Apple picking machine provides potential future of agriculture")
print(getProbabilities(doc))
// [
// (0,0, 'Apple', [ ['FRUIT', 0.99], ['ORG', 0.01] ])
// ]
使用here中描述的技术,我可以得到特定命名实体的得分,但只能得到最有可能的得分,而不能得到其他得分。