二进制分类只有"是"实例

时间:2016-03-16 23:10:46

标签: machine-learning neural-network classification svm knn

想象一下,我有二进制分类的问题。我必须为每个输入元素分配一个标签(是或否),但在训练集中我只有"是"实例。这很常见,因为很多时候我们想说一个给定的元素是否相似"对于给定与否。我们可以在声音识别或图像识别问题中找到可能的例子。

示例1:我们有许多狗吠的声音,并且如果它是狗吠叫,我们想要说出一种新的声音

示例2:我们有许多狗的照片,如果它代表一只狗,我们想要说一张新照片

在常见的机器学习问题中,训练集由" yes"实例和"不"实例并给出一个新元素,如果分类符更接近于"是"实例或" no"。

正如上述情景所预期的那样,我们不能拥有" no"实例,因为它们可能是世界上所有可能的其他声音/图片。

哪种机器学习方法(svm,神经网络,knn,......)可用于解决这类问题?

1 个答案:

答案 0 :(得分:0)

这是一个叫做新奇检测的问题。

具体来说,您有一个被认为无噪音的数据集。例如。您有一组数据代表了一些狗吠。

如果你有一些狗吠和一些猫喵,并想找到将狗与猫分开的边界,这是一个离群检测问题。

可以在SKlearn文档网站上找到一个简单的例子

http://scikit-learn.org/stable/auto_examples/svm/plot_oneclass.html#example-svm-plot-oneclass-py

具体实现将取决于您的数据究竟是什么样的 - 没有捕获所有解决方案。通过“免费午餐”#39;定理,不存在一系列在一系列问题中表现最佳的算法。