我需要根据概念的语义相似性将两个本体合并到一个文件中。为此,我使用nlp从语义上确定相似的概念。在某些情况下,本体概念用驼峰式或下划线分隔。是否有任何算法可以在语义上匹配驼峰或下划线的单词?我需要在语义上匹配以下划线分隔的驼峰命名的两个概念。 This image有一个本体,其中包含带有驼峰命名的概念。如果没有算法,请您提出一种方法?
我已经找到了一些语义上匹配两个单词或句子的算法(SEMILAR Library,cortical.io,Similarity Library,当然还有WordNet)。但是它们都不能在语义上匹配两个驼峰字母或下划线的单词。我知道我们可以尝试分开驼峰式的单词。但是我不知道下一步该怎么做。我也是nlp的新手,我不知道是否有简单的方法可以实现这一目标。
我希望有一种算法或方法可以在语义上匹配两个驼峰或下划线分隔的单词,并输出相似度分数来确定它们的语义相似度。
更新:
我还发现了这个WS4J demo用于测量单词和句子之间的语义相似性。但仍然不能将其用于驼峰式和下划线分隔的单词。