我正在EC2上作为Web服务托管的数据处理应用程序上工作,每秒生成一个.csv格式的小数据文件(小于10KB)。
问题陈述: 将生成的所有数据文件存档到Amazon Glacier。
我的方法: 由于数据文件非常小。我将文件存储在AWS Kinesis中,几小时后我将数据刷新到S3(因为我找不到直接将数据从Kinesis放入Glacier的方法),并在一天结束时使用S3生命周期管理将所有对象归档到Glacier 。
我的问题:
是否可以从Kinesis直接将数据传输到Glacier?
是否可以配置Kinesis在一天结束时将数据刷新到S3 / Glacier? Kinesis是否可以保留数据的时间或内存限制?
如果Kinesis无法将数据直接传输到Glacier。是否有类似的解决方法-我可以编写一个lambda函数来从Kinesis获取数据并将其存档到Glacier吗?
是否可以在Kinesis或S3或Glacier级别上合并所有.csv文件?
Kinesis是否适合我的用例?我还有什么可以使用的吗?
如果有人能抽出时间回答我的问题并为我提供一些参考,我将不胜感激。请让我知道我的方法是否存在缺陷,或者是否有更好的方法可以解决此问题。
谢谢。
答案 0 :(得分:0)
再次阅读您的问题,看到您使用的是csv文件,我强烈建议您使用Kinesis> S3> Athena>向冰川方法过渡