我真的很难理解如何使用Dynamo / ElasticSearch来支持AWS数据湖工作(元数据/目录)。您似乎会在Dynamo中记录zip存档的各个S3位置以及您希望在ES中搜索的任何其他元数据/属性。如果这是正确的,你将如何使用这两者来支持它。我试图找到关于如何将两者正确配对的更详细信息,但一直没有成功。其他人拥有的任何信息/文件都会很棒。很有可能我忽略了一些明显的例子/文档。
我想象的是以下内容:
答案 0 :(得分:1)
我与我们的一位AWS代表进行了交谈,他们将我推荐给了本文。这是一个很好的起点。 AWS Data Lake。这似乎回答了我关于组件和方法的用户的一些问题,这在我之前并不清楚。
亮点: