如何在Hive上从本地磁盘上的数据而不是HDFS创建外部表?

时间:2015-08-05 23:26:59

标签: hadoop hive cloudera cloudera-cdh impala

有关HDFS的数据,我们可以

CREATE EXTERNAL TABLE <table>
{
id INT,
name STRING,
age INT 
} LOCATION 'hdfs_path';

但是如何为上面的LOCATION指定本地路径?

感谢。

2 个答案:

答案 0 :(得分:3)

您可以先使用&#34; hdfs dfs -put&#34;将文件上传到HDFS。然后在其上创建Hive外部表。

Hive无法在本地文件上创建外部表的原因是,当Hive处理数据时,实际处理发生在Hadoop集群上,而本地文件可能根本无法访问。

答案 1 :(得分:0)

我认为您无法在本地文件系统上创建外部表。最接近的是使用LOCATION 's3://yourbucket/'

在AWS S3存储桶上创建外部表