我正在将S3 Buckets连接到Apache Hive,以便我可以直接通过PrestoDB查询S3中的Parquet
个文件。
为此,我配置了hive-site.xml
文件,并在文件中添加了AWS Access Key和Secret Key,如this blog post中所述。现在,Parquet
文件所在的S3存储桶URL路径如下所示:
https://s3.console.aws.amazon.com/s3/buckets/sb.mycompany.com/someFolder/anotherFolder/?region=us-east-2&tab=overview
创建外部表时,我将S3的位置指定为:
LOCATION "s3://sb.mycompany.com/someFolder/anotherFolder"
Apache Hive 无法在上述位置找到镶木地板文件,因为它没有向查询返回任何数据。此文件夹包含多个镶木地板文件我的问题:
答案 0 :(得分:0)
如果数据已分区,则需要修复该表,在某些情况下,即使没有分区也必须修复该表,请在配置单元中使用以下命令:
设置hive.msck.path.validation = ignore;
msck修复表schema.table;