当我浏览异常检测器API的文档时,我发现有两个API(或“模式”):/ last和/ entire。医生说他们正在流媒体与批处理模式。但是,我认为消息不是很清晰,并且两个API /模式似乎具有真正相似的功能。 我有一些来自工厂车间传感器的物联网数据;我可以对数据进行预处理,以确保其符合API要求;我可以在我的应用程序中使用C#进行编码。 谁能帮助您详细说明如何为我的方案选择更好的API?
我已经在Azure笔记本中尝试了两种API
答案 0 :(得分:1)
感谢您使用异常检测器。
Anomaly Detector API的批处理检测端点使您可以通过整个时间序列数据检测异常。在这种检测模式下,将创建一个统计模型并将其应用于数据集中的每个点。如果您的时间序列具有以下特征,建议您使用批处理检测功能在一个API调用中预览数据。
我们不建议对实时数据监视使用批处理异常检测,或者对不具有上述特征的时间序列数据使用批处理异常检测。
批量检测仅创建并应用一个模型,每个点的检测都是在整个序列的上下文中完成的。
如果时间序列数据在没有季节性的情况下上下波动,则模型可能会遗漏某些变化点(数据中的尖峰和尖峰)。同样,某些变化点在数据集中的重要性不如其后的变化点,其重要性可能不足以纳入模型。
由于要分析的点数很多,因此在进行实时数据监视时,批次检测比检测最新点的异常状态要慢。
对于实时数据监视,我们建议仅检测最新数据点的异常状态。通过持续应用最新的点检测,可以更有效,更准确地完成流数据监视。
以下示例描述了这些检测模式可能对性能产生的影响。第一张图片显示了沿28个先前看到的数据点连续检测异常状态最新点的结果。红点是异常。
An image showing anomaly detection using the latest point
以下是使用批处理异常检测的相同数据集。为该操作构建的模型已忽略了多个以矩形标记的异常。
An image showing anomaly detection using the batch method
再次感谢,我们将信息添加到AD服务的公共文档中。