我试图计算它们长度不同的2个整数数组之间的相似性。我使用了一种名为 jaccard相似性的方法,它依赖于交叉和联合。这是使用jaccard获取相似性的使用代码
//jaccard similarity
var CommonNumbers = from a in A.AsEnumerable<int>()
join b in B.AsEnumerable<int>() on a equals b
select a;
double JaccardIndex = (((double)CommonNumbers.Count()) /
((double)(A.Count() + B.Count())));
但是我注意到这种方法对我的情况不利,因为它取决于组之间的CommonNumbers,这对我的情况不利
如果不等于2个数组,我可以使用余弦相似性吗?
有哪些提示可以更好地计算两个不相等的整数数组之间的相似度?
提前致谢。