我最近加入了一个项目,我们在其中使用Amazon Glue表(通过Spark-Sql)查询数据,这些数据存储在S3上具有活泼压缩的实木复合地板文件中。我对这些技术完全陌生,因此想学习和收集有关这些主题的知识-
1) AWS S3 (Architecture & CLI)
2) Parquet Files & Snappy compression and some practical knowledge as to how to inspect data in those files manually
3) AWS Glue tables and catalogs (architecture etc)
任何人都可以为我提供指向任何在线(或其他)资源的正确方向,这些资源可以帮助我理解和获取有关这些主题的知识吗? 谢谢