有一个Hadoop集群和一个随附的Hive Metastore,它描述了S3上各种数据的位置和架构。我没有访问集群的权限,但是可以访问MySQL Metastore。
我想以表的形式访问S3 上的数据,但是鉴于我的访问模式不常见,Amazon Athena在意义上比启动EMR集群并指向Hive Metastore更有意义。问题是我需要先在雅典娜CREATE EXTERNAL TABLE
才能查询数据。
我知道Metastore具有生成CREATE TABLE
查询并传递给Athena所需的所有数据。
是否有任何现有工具或代码可以为我生成此查询?我应该用SQL还是Python生成CREATE TABLE
语句?