应用错误收集

Kafka是由LinkedIn开发的，它在LinkedIn中的角色是日志聚合中心。所以卡夫卡非常适合处理这类问题。

我认为每个事件（事件就像页面访问或查询）都应该在Web服务器中标记时间戳，而不是在日志发送到Kafka时。更具体地说，当页面访问事件发生时，它实际上向您的Web服务器发出请求，然后您的Web服务器处理此请求并返回响应。同时，您的Web服务器应该使用时间戳记录此事件，并且此时间戳是该事件的唯一正确时间点。关于如何记录事件？您可以创建一个log_producer来将日志消息发送到Kafka的特定主题，而不仅仅是将其记录在本地文件中。

关于批处理每小时的日志，您可以创建24个分区并将日志“HOUR”作为分区键，然后如果您执行批处理，则只需要拉出分区H的日志（如果您需要的小时）处理是H.因为您只需要处理最新的H小时日志，所以旧的H'log已经过旧处理工作的处理和保存。

每小时或每天都有卡夫卡话题是否典型？

1 个答案: