构建一个仅包含一个类

时间:2018-04-19 21:04:13

标签: machine-learning classification

我公司制作小部件。我们制作非常高质量的小部件,但偶尔小部件会遭遇被称为“神秘”的缺陷。一个小部件可能永远不会在其整个生命周期中滑动,它可能会一次性滑动,或者它可能会多次滑动。小部件的生命周期可能是几个月或多年。

我们维护一个数据库,列出一个小部件的每个实例。对于每个glurb事件,我们知道哪个窗口小部件出现了亮点,当它出现问题时,我们在窗口小部件出现问题之前就已经有了关于窗口小部件的功能。我们100%确定当小部件出现问题时,它会记录在我们的数据库中。

管理层希望建立一个机器学习模型,给定一个特定的小部件,可以预测它是否会在接下来的六个月内进入。

我遇到了一个问题:我有一组观察结果显示小部件是否会出现问题,这是一个积极因素。训练集,但我没有“负面”#39; (没有歌曲)训练集。

对我来说,随机选择一个时间,日期和小部件,查看我的数据库,如果我看到该小部件在所选日期/时间后6个月内没有刷新,则在统计上有效作为一个没有'不作为一个'事件,把它放在我的负面'训练集样本?

是否存在统计上有效的方法来生成“否定”消极信息。从我的数据测试集?如果是这样,会是什么?如果没有,我怎么能从我拥有的数据构建分类器?

2 个答案:

答案 0 :(得分:1)

是的,这样做是有效的。根据您的管理部门的要求,您是100%正确的。您将根据定义预测未来6个月内小部件是否会消失

请记住这个问题与预测小工具 在其生命周期中的问题不同。

答案 1 :(得分:0)

对“一级分类”进行了一些研究。以下是几篇论文:

如果您的数据采用图像形式,则可以尝试使用生成对抗网络(GAN)生成负数据。这里有一个关于这个问题的帖子:Could I use GANs to generate negative samples for one class classification?他参考了约翰内斯的论文。

如果您使用Python编程,请查看SciKit-Learn提供的内容: