python监督学习与数据集分类

时间:2020-06-20 20:39:41

标签: python deep-learning pattern-matching

我是深度学习的新手,目前正在研究某个主题。我正在寻找时间序列模式中异常的机器学习检测及其在python中的实现。

例如,我记录了某个时间间隔内计算机的不同CPU频率。我想实现一种监督学习算法,该算法将CPU频率的时间序列作为输入,并确定在这段时间内是否发生了任何“异常”(异常CPU使用情况等)。

编辑:

我的数据集看起来是这样的,每10秒钟测量一次当前的CPU频率。我没有为每组指定确切的数据点数量,以下仅用于说明。但我希望每组大约2500个数据点:

数据集_1:{1.2、1.2、1.6、1.3、1.5、1.7、1.6、1.4、1.5}->标签:“好”

数据集_2:{1.3、1.2、1.4、1.3、1.4、1.5、1.9、2.1、2.0}->标签:“好”

Dataset_n:{1.3、1.2、3.6、3.5、1.4、1.5、3.3、3.2, 1.2}->标签:“不好”

我对监督ML算法的理解是,我拥有训练数据集。但是,到目前为止,我发现的每个教程都始终标记数据集中的每个值。就我而言,这是不可能的,因为我只能告诉我的ML算法:

a)此时间序列数据集正常

b)在此数据集中有些不正常

但是我无法标记每个单独的值,这意味着我不能说:

1.2->好

1.3->不好

1.4->好

由于存在许多不同的ML算法,因此初学者很难确定哪种算法是可以使用的。所以我的问题是:

我可以使用哪种算法(由python实现)作为开始,该算法接受整个数据集的标签,并且不希望每个值都被标记。

我希望这个问题有道理,我们欢迎您一如既往地进行编辑!谢谢!

1 个答案:

答案 0 :(得分:0)

对于此应用程序,我将使用KNN(K-最近的邻居)。 Tim的Tech拥有关于KNN的出色教程,对其进行了很好的解释并展示了实现。 希望对您有帮助