如何对大量食物名称进行聚类

时间:2015-09-01 06:20:32

标签: cluster-analysis k-means hierarchical-clustering

我有很多食物名称。我必须以某种方式进行聚类,我可以识别类似的食物。例如,所有类型的比萨饼应该在一组中,而所有类型的汉堡包都在同一组中。我可以使用什么样的聚类算法。如果已经有其他类似的分类,请建议我,并建议我可以使用它的任何工具

2 个答案:

答案 0 :(得分:0)

就我个人而言,我有一个与您的问题相同的项目。 我认为最重要的问题是找到一个丰富而有意义的语料库来训练一个好的词嵌入。 然后,您可以使用此嵌入来聚类您的数据。此外,您可以使用不同的聚类算法,并且它们中的任何一个都可以根据您的数据分布完美地工作。

答案 1 :(得分:-1)

您可以使用K-means算法执行此操作。 就工具而言,答案有很多...... 您可以使用R来减少您的工作量,因为您会发现预先安装了k ... ...

Check this one out ..将帮助您解决问题