我知道WordNet能够提供两个单词之间的语义距离,但是包含多个单词的短语呢?
是否有任何开放式库可以让我测量两个不同短语之间的语义距离?
答案 0 :(得分:3)
与单词之间的语义相似性(距离)相关联的是概念之间的相似性概念。 一种常见的方法是提取文本/短语中表达的概念,以减少词袋的概念。这样的过程并不是微不足道的(例如多义,模棱两可),但域特定工具(如生物医学领域的MetaMap)可用于将非结构化文本映射到本体/术语中定义的明确概念/术语。
因此,可以使用这样的概念包来评估利用语义图(例如本体,WordNet)的文本/短语之间的相似性,其有趣地捕获它们的真实含义。 考虑到构造概念的语义图,Semantic Measures Library(SML)可用于估计这些概念袋之间的相似性或距离。 该库是用Java开源的,开源的,并实现了广泛的措施。 还提供了一个工具包,用于使用命令行界面计算语义相似性。您可以从专用网站下载SML和工具包 http//www.semantic-measures-library.org
希望这些帮助