对于在orc格式的hive中创建的表,presto-cli上的查询失败,数据驻留在s3

时间:2017-06-15 03:40:40

标签: hive orc presto

我设置了一个Amazon EMR实例,其中包括1个Master& 1 Core(m4 Large),具有以下版本详细信息: EMR:5.5.0 Presto:Presto 0.170 Hadoop 2.7.3 HDFS Hive 2.1.1 Metastore

My Spark应用程序将ORC中的数据写入Amazon S3。然后我在hive(create external table TABLE ... partition() stored as ORC location 's3a"//')中创建了表,并尝试从presto-cli进行查询,并且我在查询SELECT * from TABLE时收到以下错误: 查询20170615_033508_00016_dbhsn失败:com.facebook.presto.spi.type.DoubleType

唯一有效的查询是: SELECT COUNT(*) from TABLE

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

发现问题所在。存储为orc时的列顺序与在hive中创建表时的列顺序不匹配:)!!!