如何使用相对频率计算两个文档(例如D1和D2)之间的欧氏距离(相似度)?
以下是使用绝对频率的两个文档之间的余弦和欧几里德距离的示例。
D1 (frequencies) = 4,9,7,0,0,3. = {16+81+49+9} = sqrt (155) = 12.45
D2 (frequencies) = 4,5,0,7,5,0. = {16+25+49+25} = sqrt (115) = 10.72
余弦D1,D2 =(4x4 + 9x5)/ 12.45x10.72 = 0.4569(绝对频率和相对频率)余弦绝对频率与相对频率相同
另外
欧几里德D1,D2 = sqrt(sqr(4-4)+ sqr(9-5)+ sqr(7)+ sqr(7)+ sqr(5)+ sqr(3))= sqrt( 0 + 16 + 49 + 49 + 25 + 9)= sqrt(148) = 12.17(绝对频率)。
相对频率为 0.2532 。
我试图获得此问题的相对频率(欧几里德),我还没有找到任何有用的教程。所有我只能找到答案 0.2532 没有公式或解释。