我们有实例集群,而每个实例都有DropWizard指标收集器。
我们还尝试利用AppDynamics自定义指标,这样可以使自定义脚本点击DropWizard公开的端点(/ metrics)并将感兴趣的指标发送到AppDynamics Controller。
AppDynamics有两个群集推出策略,用于指标在整个应用程序视图(层)中的显示方式 - SUM和AVG。
虽然这适用于像计数(使用总和)和平均处理时间(使用平均值)这样的东西 - 我们现在不知道如何聚合DropWizard暴露的每个实例百分位数 - 既不总和也不平均看起来不错。
示例:
instance1: p75=400
instance2: p75=600
instance3: p75=800
总和将给出1700当然没有用的东西。
avg 会给600 - 这也不正确 - 我们正在失去上限。
如果AppDynamics推出了MAX Cluster - 这或多或少都是公平的 - 但仍然不正确。但AppDynamics没有这个。
我们也理解,收集群集百分位数的唯一完全正确的方法是从一个地方的所有节点(例如logstash等)执行聚合,而不是在每个实例上执行聚合。但就目前而言,这就是我们所拥有的 - 只是定期发送自定义指标。
如果有人就此提出建议,那将会很棒。
提前致谢,