如果您依赖亚马逊AWS服务运营,您需要密切关注其服务的状态。亚马逊使用网站http://status.aws.amazon.com/,该网站提供指向特定地区特定服务的RSS源的链接。
我们的服务使用S3,CloudFront和其他服务进行操作。我们希望了解在运营时间内可能出现的任何服务,并在出现问题时自动执行我们应该做的事情。
我们使用Splunk记录我们的所有服务。
例如,如果在写入S3时应用程序中发生错误,我们想知道这是否是由AWS中的潜在中断引起的。
答案 0 :(得分:0)
syndication
sourcetype下的Splunk索引中获取有错误并存储的RSS项。since
字段,以便我们随时调整提醒。请您的Splunk团队在您需要的环境中安装“Syndication Input”应用。
之后,只需收集所需的每个RSS源并将其添加到Settings -> Data Input -> Syndication Feed
。从Amazon Status RSS提要中获取所有URL并将其用作Splunk数据输入,以一定的间隔填写表单:
完成后,Syndication App会有以下内容:
在发生错误时使用搜索错误,调整“自”日期,以便您可以为结果创建警报。我过去添加了一天只是为了展示目的。
since
应该是您开始监控AWS的开始日。当亚马逊发布从文本Informational message:
捕获的新错误时,这有助于查询导致任何新事件。RESOLVED
已附加到新的RSS Feed项目,因此我们会将其从警报中排除。
sourcetype=syndication "Informational message:" NOT "RESOLVED"
| eval since=strptime("2010-08-01", "%Y-%m-%d")
| eval date=strptime(published_parsed, "%Y-%m-%dT%H:%M:%SZ")
| rex field=summary_detail_base "rss\/(?<aws_object>.*).rss$"
| where date > since
| table aws_object, published_parsed, id, title, summary
| sort -published_parsed