Hive LLAP不适用于Parquet格式

时间:2017-05-03 22:32:22

标签: hive parquet hdinsight

finding out Hive LLAP之后,我真的想要使用它。

我启动了启用了LLAP的Azure HDinsight群集。但是,它似乎没有比普通的Hive更好的工作。我有数据存储在Parquet文件中。我只看到LLAP相关文档或会谈中提到的ORC文件。

它是否也支持Parquet格式?

2 个答案:

答案 0 :(得分:1)

回答我自己的问题。

我们联系了Azure支持。 Hive LLAP仅适用于ORC文件格式(截至05.2017)。

因此,对于Parquet,我们必须使用Apache Impala进行快速交互式查询(Castle Windsor docs),以替代LLAP或将存储的文件格式更改为ORC。

答案 1 :(得分:1)

更新:目前正在进行此工作,下一版HDP将不再适用。截至HDP 3.0。 LLAP将支持Parquet文件格式的缓存。此更新应在3.0版本发布后不久流入HDInsights。