我有3个数组,其中包含从三个搜索引擎读入的文档列表。该数组包含关键信息,如URL,标题和描述。
最终,我希望对文档中的文档进行排名,并使用Reciprocal Rank Fusion对它们进行聚合,根据文档在每个数组中的排名对文档进行评分:
Document_Score = (1/(60+rank_google)) + (1/(60+rank_yahoo)) + (1/(60+rank_bing))
问题是:
我需要通过检查唯一标识文档的URL来隔离每个文档。 因此,关键信息包含在以下内容中:
googlearray[$i]['url'];
yahooarray[$i]['url'];
bingarray[$i]['url'];
问题:
有人能建议一种简单的方法,我可以在每个引擎中隔离一个特定的文件(基于它的 url ),这样我就可以在每个文件上执行聚合公式吗? (效率很好,但现在很简单)
欢迎提供任何线索或建议:)
感谢。