应用错误收集

使用Splunk监控AmazonS3日志？

时间：2012-05-03 02:41:46

标签： amazon-s3 amazon-web-services splunk access-log

我们有一个庞大的扩展用户网络，我们使用徽章进行跟踪。总流量每月接近6000万印象。我们目前正在考虑从一个相当慢的，基于数据库的日志记录解决方案（在PHP-messy上定制...）转换为依赖于Amazon S3日志和Splunk的简单的基于日志的替代方案。

在使用Splunk进行其他分析任务后，我非常喜欢它。但目前尚不清楚如何在系统中设置S3这样的源代码。似乎远程数据源需要安装Universal Forwarder，这不是那里的选择。

有关于此的任何想法吗？

4 个答案:

答案 0 :(得分：1)

答案非常晚，但我一直在寻找相同的东西，并找到了一个符合你想要的Splunk应用程序http://apps.splunk.com/app/1137/。我还没试过。

答案 1 :(得分：0)

我建议将j-son预处理数据记录到documentdb数据库。例如，使用符合您的场景的azure队列或simmilar服务总线消息传递技术以及azure documentdb。因此，我将保留基于数据库的方法，并将其修改为无架构的易于扩展的基于文档的数据库。

答案 2 :(得分：0)

我使用AWS Marketplace中的http://www.insight4storage.com/来跟踪我的AWS S3存储使用总数，包括前缀，存储桶或存储类;加上它显示了以前的版本存储前缀和每桶。除了UI和Web服务API之外，它还有一个设置可以将S3数据保存为可能适用于您的用例的splunk格式日志。

答案 3 :(得分：0)

您使用Splunk Add-On for AWS。

这是我的理解，

创建一个Splunk实例。使用网站版本或内部部署 splunk的AMI在运行splunk的地方创建EC2。
在EC2上为AWS应用程序安装Splunk加载项。
根据输入日志类型（例如Cloudtrail日志，Config日志，通用日志等）配置加载项并提供AWS账户ID或IAM角色等参数。
附加组件将在指定的时间（默认为30秒）后自动ping AWS S3源并获取最新日志。

对于通用用例（如我们的用例），您可以尝试配置Generic S3 input for Splunk