聚类词

时间:2013-04-25 12:25:51

标签: nlp cluster-analysis

我有一个单词列表。我正在寻找一种在语义上将这些单词聚集在一起的方法。谁能告诉我有关完成此操作的库或工具?我一直在网上搜索这个,但不符合我的要求。大多数单词都是技术性的,因此不会在任何字典中找到。我想在单词列表上执行本体聚类。

1 个答案:

答案 0 :(得分:2)

你有一个集合,所以你有一个上下文可以使用吗?

如果你有一个给定的集合,你可以使用你可以计算每对术语一起出现的文档数量,并根据它计算它们之间的一些语义相似性,如 [Jaccard](http://en.wikipedia.org/wiki/Jaccard_index)或[Dice](http://en.wikipedia.org/wiki/Dice%27s_coefficient)。