“集体智慧规划”一书中的tanimoto系数

时间:2014-10-24 02:04:01

标签: data-mining

我读过“集体智慧编程”一书。对于第2章的课后练习1,有人可以告诉我如何计算 tanimoto系数?一个特定的数学公式将非常感激。

1 个答案:

答案 0 :(得分:1)

对相关问题的广泛搜索给了我两个公式:

  1. 找到T(a,b)= N_intersection /(N_a + N_b - N_intersection)here,这与维基百科上的相同,略微可读。 编辑:根据你的评论,这是OP正在寻找的。

  2. (n_11 + n_00)/ [n_11 + 2(n_10 + n_01)+ n_00],其中

    • n_11:都有属性,
    • n_00:两者都没有属性,
    • n_01或n_10:只有第二个/第一个对象具有该属性。
  3. 对于第二个等式的来源,请查看http://reference.wolfram.com/language/ref/RogersTanimotoDissimilarity.html,并从相异度指数计算相似性指数为(1-不相似度)。

    我认为第二个公式通常用于应用统计和应用营销。