应用错误收集

时间：2017-10-18 07:13:35

标签： streaming spark-streaming apache-storm apache-flink

我读过一些文章，对Spark Stream，Storm和Flink等流处理引擎的性能进行基准测试。在评估部分，标准是第99百分位数和吞吐量。例如，Apache Kafka每秒发送大约100.000个事件的数据，这三个引擎充当流处理器，并使用99％的延迟和吞吐量来描述它们的性能。

有人可以为我澄清这两个标准吗？

答案 0 :(得分：1)

流作业中X毫秒的第99个百分位延迟表示，有99％的项目在不到X毫秒的时间内到达管道的末端。阅读this reference了解更多详情。

当应用程序开发人员期望一定的延迟时，他们通常需要潜伏期我们测量流的几个延迟范围记录分组作业，可通过网络对数据进行混洗。的下图显示了观察到的中值潜伏期，以及第90、95和99个百分位（延迟时间的99个百分位例如，50毫秒表示99％的元素到达在不到50毫秒的时间内结束管道。