我设置了一个Amazon EMR实例,其中包括1个Master& 1 Core(m4 Large),具有以下版本详细信息: EMR:5.5.0 Presto:Presto 0.170 Hadoop 2.7.3 HDFS Hive 2.1.1 Metastore
My Spark应用程序将ORC中的数据写入Amazon S3。然后我在hive(create external table TABLE ... partition() stored as ORC location 's3a"//'
)中创建了表,并尝试从presto-cli进行查询,并且我在查询SELECT * from TABLE
时收到以下错误:
查询20170615_033508_00016_dbhsn失败:com.facebook.presto.spi.type.DoubleType
唯一有效的查询是:
SELECT COUNT(*) from TABLE
有什么想法吗?
答案 0 :(得分:0)
发现问题所在。存储为orc时的列顺序与在hive中创建表时的列顺序不匹配:)!!!