用于Data Lake架构的AWS中的数据目录和元数据管理

时间:2017-06-20 16:29:43

标签: amazon-web-services metadata data-lake bigdata

我们正在基于Data Lake架构松散地建立数据平台。我们正在评估提供集中数据目录和元数据管理和标记的候选者。胶水看起来非常有前途,但它还没有公开消费,所以我们研究了

  • 接地
  • 水线
  • Zaloni

地面相当DYI。我们似乎必须广泛扩展它以使其适用于我们。 (从S3中剔除,写作泰坦)

Waterline和Zaloni是完整的解决方案,可能不是我们想要的,因为我们更喜欢开源,点解决方案。

我们应该寻找任何替代方案吗?我们喜欢Ground中提供的MetaModel,并倾向于使用Kinesis模式管理。

1 个答案:

答案 0 :(得分:1)

重新考虑DIY路线可能值得。您将浪费大量时间来构建您想要的产品并支持它,而不是使用它。 我知道这有点营销,但是Zaloni's页面表示650%的投资回报率而非构建自己的投资回报率。在那里必须至少有一点东西。