肯德尔头的距离

时间:2010-09-24 00:16:02

标签: list comparison

the wikipedia article解释了Kendall tau编辑距离,但没有对可能的应用程序说太多。什么时候使用tau距离? 我正在寻找现实世界的例子,而不是发明数学的例子。

3 个答案:

答案 0 :(得分:2)

Kendall Tau可用作衡量搜索结果之间相似性的指标。例如,可以比较Google和Bing(对于同一查询)产生的前10名结果的接近程度。

答案 1 :(得分:1)

通过查找元组之间的相似性进行分组。阅读“编程集体智慧”,了解真实应用程序的外观。想想Netflix。

答案 2 :(得分:0)

我正在使用YouTube上的一组视频元素。这些视频具有评论数量或标题长度等功能。有些但并非所有人都有平均评级或喜欢和不喜欢。为了对这些做出高质量的陈述,我研究了地面真实质量陈述与其他特征之间的相关性。事实证明,存在一些重要的相关性,例如,评论计数与平均评级相关。因此,我可以假设其质量视频的评论数量。

Example from SciPy(将x1x2视为comment_countrating_average):

>>> x1 = [12, 2, 1, 12, 2]
>>> x2 = [1, 4, 7, 1, 0]
>>> tau, p_value = sp.stats.kendalltau(x1, x2)
>>> tau
-0.47140452079103173
>>> p_value
0.24821309157521476