标签: algorithm relevance
我需要一种算法来计算和衡量两个单词或短语的相关性,例如: “Apple”和“iPad”。
有人可以就这些话题给我一些提示或相关书籍吗?
感谢。
答案 0 :(得分:4)
查看mutual information和tf-idf。这些是在信息检索中经常使用的方法。前者量化了两个变量的相互依赖性(每个变量可以是一个短语)。搜索引擎传统上使用后者来确定与特定查询相关的结果的优先级。