标签: rapidminer
我正在使用Rapidminer使用交叉距离比较同一excel文件中两张纸之间的相似度,因为我要比较一个请求,所有参照都将通过余弦相似度返回相似度值,问题是距离返回为问号find_in_set()不知道原因。
find_in_set()
处理XML:
?
流程概述:
答案 0 :(得分:0)
最可能的原因是,数据中的某处具有无限值。对于它们,余弦距离没有定义,因此您得到一个“?”也就是您的结果缺少价值。
在这种情况下,可以在计算之前使用Replace Infinite Values运算符。
Replace Infinite Values