何时在Azure异常检测器中使用“ / entire”与“ / last” API?

时间:2019-04-19 05:30:35

标签: anomaly-detection azure-anomaly-detection azure-anomaly-detector

当我浏览异常检测器API的文档时,我发现有两个API(或“模式”):/ last和/ entire。医生说他们正在流媒体与批处理模式。但是,我认为消息不是很清晰,并且两个API /模式似乎具有真正相似的功能。 我有一些来自工厂车间传感器的物联网数据;我可以对数据进行预处理,以确保其符合API要求;我可以在我的应用程序中使用C#进行编码。 谁能帮助您详细说明如何为我的方案选择更好的API?

我已经在Azure笔记本中尝试了两种API

1 个答案:

答案 0 :(得分:1)

感谢您使用异常检测器。

Anomaly Detector API的批处理检测端点使您可以通过整个时间序列数据检测异常。在这种检测模式下,将创建一个统计模型并将其应用于数据集中的每个点。如果您的时间序列具有以下特征,建议您使用批处理检测功能在一个API调用中预览数据。

  1. 一个季节性的时间序列,偶尔会有异常。
  2. 平坦的趋势时间序列,偶有峰值/下降。

我们不建议对实时数据监视使用批处理异常检测,或者对不具有上述特征的时间序列数据使用批处理异常检测。

  1. 批量检测仅创建并应用一个模型,每个点的检测都是在整个序列的上下文中完成的。

    如果时间序列数据在没有季节性的情况下上下波动,则模型可能会遗漏某些变化点(数据中的尖峰和尖峰)。同样,某些变化点在数据集中的重要性不如其后的变化点,其重要性可能不足以纳入模型。

  2. 由于要分析的点数很多,因此在进行实时数据监视时,批次检测比检测最新点的异常状态要慢。

对于实时数据监视,我们建议仅检测最新数据点的异常状态。通过持续应用最新的点检测,可以更有效,更准确地完成流数据监视。

以下示例描述了这些检测模式可能对性能产生的影响。第一张图片显示了沿28个先前看到的数据点连续检测异常状态最新点的结果。红点是异常。

An image showing anomaly detection using the latest point

以下是使用批处理异常检测的相同数据集。为该操作构建的模型已忽略了多个以矩形标记的异常。

An image showing anomaly detection using the batch method

再次感谢,我们将信息添加到AD服务的公共文档中。