使用维基百科的单词相似度算法

时间:2014-06-12 05:10:58

标签: nlp cluster-analysis data-analysis hierarchical-clustering text-analysis

我希望计算两个单词之间的距离

Word1 - ManchesterUnited Word2 - RyanGiggs

我觉得使用维基百科是一个非常好的选择。 我会尝试确定两个词与常见类别或主题的距离。我可以使用哪些算法来确定常见主题? 我的下一个问题是如何在常见主题下获得层次结构,以便我可以计算单词的距离?

我还想知道是否还有其他方法来计算两个单词之间的距离。如果能够轻松有效地实施它将会很好。

1 个答案:

答案 0 :(得分:4)

为什么不使用已经在WIKI上训练的https://code.google.com/p/word2vec/