想象一下,我有二进制分类的问题。我必须为每个输入元素分配一个标签(是或否),但在训练集中我只有"是"实例。这很常见,因为很多时候我们想说一个给定的元素是否相似"对于给定与否。我们可以在声音识别或图像识别问题中找到可能的例子。
示例1:我们有许多狗吠的声音,并且如果它是狗吠叫,我们想要说出一种新的声音
示例2:我们有许多狗的照片,如果它代表一只狗,我们想要说一张新照片
在常见的机器学习问题中,训练集由" yes"实例和"不"实例并给出一个新元素,如果分类符更接近于"是"实例或" no"。
正如上述情景所预期的那样,我们不能拥有" no"实例,因为它们可能是世界上所有可能的其他声音/图片。
哪种机器学习方法(svm,神经网络,knn,......)可用于解决这类问题?
答案 0 :(得分:0)
这是一个叫做新奇检测的问题。
具体来说,您有一个被认为无噪音的数据集。例如。您有一组数据代表了一些狗吠。
如果你有一些狗吠和一些猫喵,并想找到将狗与猫分开的边界,这是一个离群检测问题。
可以在SKlearn文档网站上找到一个简单的例子
http://scikit-learn.org/stable/auto_examples/svm/plot_oneclass.html#example-svm-plot-oneclass-py
具体实现将取决于您的数据究竟是什么样的 - 没有捕获所有解决方案。通过“免费午餐”#39;定理,不存在一系列在一系列问题中表现最佳的算法。