我有一个数据集,其中包含来自客户的访问历史记录。
数据集中有三列,包括客户ID,AM / PM(上午或下午访问)和工作日/周末(工作日或周末访问)。
我想从这个数据集中学习并选择最有可能在指定输入中访问的前50位客户(如AM /工作日)。
目前,我使用一类SVM为每个客户创建模型(我只有正(访问)数据)。由于一类SVM只有二进制输出,我只能告诉某个客户是否会在指定的输入中访问,而不是选择前50位客户。
我想知道是否有一种算法可以从只有正数的数据集中学习并给出得分或输出概率?
答案 0 :(得分:0)
这是机器学习中的子类别问题。你可以从这个调查中学到很多东西:“一类分类:研究分类和评论 技巧“(http://arxiv.org/pdf/1312.0049.pdf)。希望它有所帮助。