在finding out Hive LLAP之后,我真的想要使用它。
我启动了启用了LLAP的Azure HDinsight群集。但是,它似乎没有比普通的Hive更好的工作。我有数据存储在Parquet文件中。我只看到LLAP相关文档或会谈中提到的ORC文件。
它是否也支持Parquet格式?
答案 0 :(得分:1)
回答我自己的问题。
我们联系了Azure支持。 Hive LLAP仅适用于ORC文件格式(截至05.2017)。
因此,对于Parquet,我们必须使用Apache Impala进行快速交互式查询(Castle Windsor docs),以替代LLAP或将存储的文件格式更改为ORC。
答案 1 :(得分:1)
更新:目前正在进行此工作,下一版HDP将不再适用。截至HDP 3.0。 LLAP将支持Parquet文件格式的缓存。此更新应在3.0版本发布后不久流入HDInsights。