标签: nlp cluster-analysis data-analysis hierarchical-clustering text-analysis
我希望计算两个单词之间的距离
我觉得使用维基百科是一个非常好的选择。 我会尝试确定两个词与常见类别或主题的距离。我可以使用哪些算法来确定常见主题? 我的下一个问题是如何在常见主题下获得层次结构,以便我可以计算单词的距离?
我还想知道是否还有其他方法来计算两个单词之间的距离。如果能够轻松有效地实施它将会很好。
答案 0 :(得分:4)
为什么不使用已经在WIKI上训练的https://code.google.com/p/word2vec/?