使用欧氏距离的相对频率

时间:2014-08-13 10:45:44

标签: similarity information-retrieval euclidean-distance cosine-similarity data-retrieval

如何使用相对频率计算两个文档(例如D1和D2)之间的欧氏距离(相似度)?

以下是使用绝对频率的两个文档之间的余弦和欧几里德距离的示例。

D1 (frequencies) = 4,9,7,0,0,3. = {16+81+49+9} = sqrt (155) = 12.45

D2 (frequencies) = 4,5,0,7,5,0. = {16+25+49+25} = sqrt (115) = 10.72

余弦D1,D2 =(4x4 + 9x5)/ 12.45x10.72 = 0.4569(绝对频率和相对频率)余弦绝对频率与相对频率相同

另外

欧几里德D1,D2 = sqrt(sqr(4-4)+ sqr(9-5)+ sqr(7)+ sqr(7)+ sqr(5)+ sqr(3))= sqrt( 0 + 16 + 49 + 49 + 25 + 9)= sqrt(148)   = 12.17(绝对频率)。

相对频率 0.2532

我试图获得此问题的相对频率(欧几里德),我还没有找到任何有用的教程。所有我只能找到答案 0.2532 没有公式或解释。

1 个答案:

答案 0 :(得分:0)

阅读欧几里德距离here以便更好地理解