Impala可以在Alluxio之上运行吗?

时间:2018-09-28 02:21:18

标签: impala alluxio

我尝试将Impala配置为在Alluxio之上运行,但是失败了。

以下是Impala配置:

/etc/impala/conf/core-site.xml(http://www.alluxio.org/docs/1.6/en/Running-Hadoop-MapReduce-on-Alluxio.html

<configuration>
<property>
  <name>fs.alluxio.impl</name>
  <value>alluxio.hadoop.FileSystem</value>
  <description>The Alluxio FileSystem (Hadoop 1.x and 2.x)</description>
</property>
<property>
  <name>fs.AbstractFileSystem.alluxio.impl</name>
  <value>alluxio.hadoop.AlluxioFileSystem</value>
  <description>The Alluxio AbstractFileSystem (Hadoop 2.x)</description>
</property>
</configuration>

/etc/impala/conf/hive-site.xml(http://www.alluxio.org/docs/1.6/en/Running-Hive-with-Alluxio.html

<property>
   <name>fs.defaultFS</name>
   <value>alluxio://master_hostname:port</value>
</property>

然后我启动了Impala(impala服务器,impala目录,impala状态存储),但是在日志中我发现了这一点:

...impala-server.cc:282] Currently configured default file system: FileSystem. fs.defaultFS (alluxio://192.168.1.10:19998/) is not supported.
...impala-server.cc:285] Aborting Impala Server startup due to improper configuration. Impalad exiting.

我在Bing上进行了很多搜索,但是没有运气。甚至搜索关键词'alluxio上的impala'的搜索结果也很少。那么,Impala可以在alluxio之上运行吗?任何建议将不胜感激。

我的Impala版本:2.10.0-cdh5.13.0 RELEASE,Alluxio版本:alluxio-1.8.0-hadoop-2.7

1 个答案:

答案 0 :(得分:2)

您尝试过running Hive with external tables on Alluxio吗?代替将Alluxio设置为defaultFS,删除

<property>
   <name>fs.defaultFS</name>
   <value>alluxio://master_hostname:port</value>
</property>

并使用类似于以下内容的方法在Alluxio上创建表:

hive> CREATE TABLE u_user (
userid INT,
age INT,
gender CHAR(1),
occupation STRING,
zipcode STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
LOCATION 'alluxio://master_hostname:port/table_path';

这可能有助于解决Impala的文件系统实施检查。 CDH 5.13及更低版本中还存在一个错误,该错误会阻止Impala在Alluxio中读取数据。您可能需要升级到CDH 5.14,从而解决了该问题。