标签: parsing spacy lemmatization
我正在使用en_core_web_sm模型版本2.0.0解析以下两个句子:"Rabbits are mammals"和"Rabbits have hair"。在第一句中,我获得了带有引理'rabbit',ID为10130653840019909946的令牌,而在第二句中,我获得了带有'rabbits'的{{1}}。这是令人惊讶的。这是模型中的错误还是我误解了什么?我已尝试对4224103442939446549做同样的事情,但结果完全相同。
en_core_web_sm
"Rabbits are mammals"
"Rabbits have hair"
'rabbit'
10130653840019909946
'rabbits'
4224103442939446549