我有一个单词列表。我正在寻找一种在语义上将这些单词聚集在一起的方法。谁能告诉我有关完成此操作的库或工具?我一直在网上搜索这个,但不符合我的要求。大多数单词都是技术性的,因此不会在任何字典中找到。我想在单词列表上执行本体聚类。
答案 0 :(得分:2)
你有一个集合,所以你有一个上下文可以使用吗?
如果你有一个给定的集合,你可以使用你可以计算每对术语一起出现的文档数量,并根据它计算它们之间的一些语义相似性,如 [Jaccard](http://en.wikipedia.org/wiki/Jaccard_index)或[Dice](http://en.wikipedia.org/wiki/Dice%27s_coefficient)。