我已经开发了一个子工具,最终用户应该可以看到与他当前正在浏览的公司相似的公司。我已经通过公司描述的tf-idf进行了此操作,然后计算了与数据库中所有公司的余弦相似度。
到目前为止,结果很好,但是我希望能够识别出输出不好的情况(在这种情况下,能够使用替代引擎)。我意识到,在这种情况下,该算法会输出完全不同部门的公司,它们之间没有共同点。因此,我认为我可以计算出10个输出结果之间的交叉相似度(即10x10相似度)并取其平均值。我的直觉是,当产出良好时,公司全部来自同一部门,并且相当相似;而当产出不好时,公司则来自随机部门,根本不相似。因此,至少我认为,不同结果之间的平均相似度应该可以很好地代表输出质量!
不幸的是,输出结果之间的平均相似性与输出质量根本不相关!我还试图分析前10个结果的余弦值的标准偏差是否会对质量产生影响,但不幸的是,情况并非如此。
有人会知道一个指标,通过它我可以预测推荐引擎的输出是好是坏。在这种情况下,我想使用备用引擎。