Ghahramani和Heller(http://mlg.eng.cam.ac.uk/zoubin/papers/bsets-nips05.pdf)提出的贝叶斯集合提供了一种基于查询查找项目集合的有用方法(例如,狗会返回cat,pet)并产生与谷歌集合相当的输出。我想知道如何在不首先提供单词(item)作为查询的情况下如何使用该方法来查找顶部集合。是否有人知道贝叶斯集合的主动学习,其中识别出密度最高的集合?
答案 0 :(得分:0)
贝叶斯集基本上执行特征选择(参见:基于内容的图像检索的简单贝叶斯框架)来对集合中的项进行排名。并且通过该组的种子示例来确定特征的权重。没有种子,就没有办法实现这一目标。所以归结为找到“种子套”。
为此,您可以在数据中找到“群集”(例如使用K-means)并将其“质心”(或表示群集的数据点)作为种子集提供。基本上,现在你要做的是对每个集群中的项目进行排名(你可以称之为topsets)。