检查文本数据之间的相似性

时间:2015-07-01 15:27:27

标签: cluster-analysis similarity measure

请指导我如何测量聚类的文本数据的相似性,我们可以使用欧氏距离测量或任何其他距离测量来测量数值数据。数据是用于从网站收集的搜索的关键字,第二个数据集是一些搜索返回的片段的集合。相似性在意义上应该相似。

1 个答案:

答案 0 :(得分:0)

了解tf-idf和余弦相似性。