我正在尝试衡量令牌之间的相似性。我正在使用默认的en模型。当使用单数名词时,相似性度量按预期工作,但在使用复数相同的名词时返回零。
nlp = spacy.load('en')
doc = nlp('apple orange')
doc[0].similarity(doc[1])
返回0.56189166448170025
doc = nlp('apples oranges')
doc[0].similarity(doc[1])
返回0.0
我需要实施任何预处理步骤才能使度量正常工作吗?感谢。