用于存储在S3中的胶水表的具有快速压缩功能的实木复合地板文件

时间:2019-06-20 16:19:45

标签: amazon-s3 apache-spark-sql aws-glue-data-catalog

我最近加入了一个项目,我们在其中使用Amazon Glue表(通过Spark-Sql)查询数据,这些数据存储在S3上具有活泼压缩的实木复合地板文件中。我对这些技术完全陌生,因此想学习和收集有关这些主题的知识-

1) AWS S3 (Architecture & CLI)
2) Parquet Files & Snappy compression and some practical knowledge as to how to inspect data in those files manually
3) AWS Glue tables and catalogs (architecture etc)

任何人都可以为我提供指向任何在线(或其他)资源的正确方向,这些资源可以帮助我理解和获取有关这些主题的知识吗? 谢谢

0 个答案:

没有答案