我尝试建立一个工具来计算两个单词之间的相似性,我发现曼彻斯特城市大学有一个公式如下:
到目前为止,我仍然很困惑如何在分层语义网中获得h,这是潜水员的深度。 根据我的理解,h是从顶部单词到某个单词的路径长度,作为作者的参考,顶部单词是' entity'对于NOUN。 但是ADJ,ADV,VERB等另一种词怎么样? 如果我们已经有了顶级单词,我们如何列出从它到我们需要计算的单词的路径
真的很感激任何答案。 感谢
答案 0 :(得分:0)
每当我试图理解Wordnet层次结构时,我发现某些东西会使我之前假设的一切无效:) 关于相似之处,如果您使用的是Python和NLTK,我建议您使用提供的相似性度量标准,如果没有,那么这些可能是了解事情如何运作的良好开端。
在此链接中,向下滚动至相似性: http://www.nltk.org/howto/wordnet.html
答案 1 :(得分:0)
我想添加更多我刚刚发现的细节。 这些细节足以供我搜索,但可能与上述问题不完全相同,但我认为我需要分享给将来需要它的人。
'实体'不仅是名词的根,也是任何词的根,即使它是VERB,ADJ,ADV .......
回到上面的例子,h(' kiss'' kick')的subummer的长度是6,这是从顶部树节点根到单词& #39;动作'