方案是我要向kinesis流中写入大量数据(每天TB级)。我想知道哪种是实现高写入吞吐量的更好方法。 我正在为生产者客户考虑以下两种选择。
选项1:使用Kinesis生产者库(KPL)。
或
选项2:AWS开发工具包(api)。
我知道KPL是在aws sdk之上使用的抽象,因此它基本上可以归结为(带有AWS-SDK的KPL)或仅仅是AWS-SDK。根据我的研究,在我看来,AWS-SDK没有提供将多个记录聚合到一个放置中的功能,而KPL确实支持这种聚合(如果这是错误的,请纠正我)。
PutRecords(来自Kinesis Data Streams API)和KPL(使用聚合)均提供较高的写入吞吐量,问题是两个选项中哪个更好,为什么? 简而言之,想知道将数据写入kinesis流会更快,一旦将其写入流,我就不在乎如何读取它,也对了解两种情况下的重试机制差异和异步写入性能感兴趣。 / p>