我正在努力地训练自己参加AWS的一项专业考试,然后在几个博客中看到一些使Kinesis FH与Kinesis Data Streaming用例疯狂的概念。我来找您是为了在社区的支持下打消我的念头。
Kinesis DS:具有功能以及生产者KPL和消费者KCL的高可用性侦听器(大缓冲区队列)。这项服务中最酷的一点是,它一直都在监听,并且在刷新缓冲区时不会出现这些监听中断。
Kinesis FH:这更像是一种消费者,并且会根据时间或规模来捕获来自DS的特定时间段内的所有内容。但是,我可以将有效负载直接摄取到firehose,然后这将从DS之外的其他服务中消耗掉。它需要刷新一段时间才能继续使用和处理。
我知道这些服务周围有很多属性,但是接下来我要指出那些引起我高度关注的属性。因此,围绕着许多问题都是基于Kinesis FH能够消耗自定义过程发送的有效负载这一事实。但是,从我的角度来看,这种方法不是一个好主意,因为FH花时间来刷新其缓冲区这一事实使我相信,如果尝试尝试提取,而服务每隔5分钟刷新一次该缓冲区,则可能丢失数据。相反,我可能会使用高度监听的DS服务,然后例如使用FH进行消费。
因此,我想知道我的假设是正确的还是相反,而FH刷新缓冲区则继续保持同样接收缓冲区上的有效负载,而不管刷新的缓冲区如何。是的,我去了文档,但是内容非常丰富,也许可以在这里更快地得到答案,以便继续学习计划。谢谢