标签: cluster-analysis similarity measure
请指导我如何测量聚类的文本数据的相似性,我们可以使用欧氏距离测量或任何其他距离测量来测量数值数据。数据是用于从网站收集的搜索的关键字,第二个数据集是一些搜索返回的片段的集合。相似性在意义上应该相似。
答案 0 :(得分:0)
了解tf-idf和余弦相似性。