machine-learning - 构建一个仅包含一个类

构建一个仅包含一个类

时间：2018-04-19 21:04:13

标签： machine-learning classification

我公司制作小部件。我们制作非常高质量的小部件，但偶尔小部件会遭遇被称为“神秘”的缺陷。一个小部件可能永远不会在其整个生命周期中滑动，它可能会一次性滑动，或者它可能会多次滑动。小部件的生命周期可能是几个月或多年。

我们维护一个数据库，列出一个小部件的每个实例。对于每个glurb事件，我们知道哪个窗口小部件出现了亮点，当它出现问题时，我们在窗口小部件出现问题之前就已经有了关于窗口小部件的功能。我们100％确定当小部件出现问题时，它会记录在我们的数据库中。

管理层希望建立一个机器学习模型，给定一个特定的小部件，可以预测它是否会在接下来的六个月内进入。

我遇到了一个问题：我有一组观察结果显示小部件是否会出现问题，这是一个积极因素。训练集，但我没有“负面”＃39; （没有歌曲）训练集。

对我来说，随机选择一个时间，日期和小部件，查看我的数据库，如果我看到该小部件在所选日期/时间后6个月内没有刷新，则在统计上有效作为一个没有＆＃39;不作为一个＆＃39;事件，把它放在我的负面＆＃39;训练集样本？

是否存在统计上有效的方法来生成“否定”消极信息。从我的数据测试集？如果是这样，会是什么？如果没有，我怎么能从我拥有的数据构建分类器？

2 个答案:

答案 0 :(得分：1)

是的，这样做是有效的。根据您的管理部门的要求，您是100％正确的。您将根据定义预测未来6个月内小部件是否会消失。

请记住这个问题与预测小工具时在其生命周期中的问题不同。

答案 1 :(得分：0)

对“一级分类”进行了一些研究。以下是几篇论文：

One-class classification作者David Martinus Johannes

Learning Deep Features for One-Class Classification由Pramuditha Perera，Vishal M. Patel撰写代码实现可在此处获取：https://github.com/PramuPerera/DeepOneClass

如果您的数据采用图像形式，则可以尝试使用生成对抗网络（GAN）生成负数据。这里有一个关于这个问题的帖子：Could I use GANs to generate negative samples for one class classification?他参考了约翰内斯的论文。

如果您使用Python编程，请查看SciKit-Learn提供的内容：

sklearn.svm.OneClassSVM

示例：One-class SVM with non-linear kernel (RBF)