我公司制作小部件。我们制作非常高质量的小部件,但偶尔小部件会遭遇被称为“神秘”的缺陷。一个小部件可能永远不会在其整个生命周期中滑动,它可能会一次性滑动,或者它可能会多次滑动。小部件的生命周期可能是几个月或多年。
我们维护一个数据库,列出一个小部件的每个实例。对于每个glurb事件,我们知道哪个窗口小部件出现了亮点,当它出现问题时,我们在窗口小部件出现问题之前就已经有了关于窗口小部件的功能。我们100%确定当小部件出现问题时,它会记录在我们的数据库中。
管理层希望建立一个机器学习模型,给定一个特定的小部件,可以预测它是否会在接下来的六个月内进入。
我遇到了一个问题:我有一组观察结果显示小部件是否会出现问题,这是一个积极因素。训练集,但我没有“负面”#39; (没有歌曲)训练集。
对我来说,随机选择一个时间,日期和小部件,查看我的数据库,如果我看到该小部件在所选日期/时间后6个月内没有刷新,则在统计上有效作为一个没有'不作为一个'事件,把它放在我的负面'训练集样本?
是否存在统计上有效的方法来生成“否定”消极信息。从我的数据测试集?如果是这样,会是什么?如果没有,我怎么能从我拥有的数据构建分类器?
答案 0 :(得分:1)
是的,这样做是有效的。根据您的管理部门的要求,您是100%正确的。您将根据定义预测未来6个月内小部件是否会消失。
请记住这个问题与预测小工具
答案 1 :(得分:0)
对“一级分类”进行了一些研究。以下是几篇论文:
如果您的数据采用图像形式,则可以尝试使用生成对抗网络(GAN)生成负数据。这里有一个关于这个问题的帖子:Could I use GANs to generate negative samples for one class classification?他参考了约翰内斯的论文。
如果您使用Python编程,请查看SciKit-Learn提供的内容: