如何从HDFS将数据加载到Hive中

时间:2013-08-27 20:40:08

标签: hadoop

我正在尝试从HDFS将数据加载到配置单元中。但是我观察到数据正在移动,这意味着在将数据加载到蜂巢环境中之后,如果我查看HDFS,我加载的数据就不存在了。你可以用例子来回答这个问题。

1 个答案:

答案 0 :(得分:2)

如果您想从HDFS中的数据在Hive中创建表而不将数据移到/user/hive/warehouse/,则应使用可选的EXTERNALLOCATION关键字。例如,从this page开始,我们有以下示例CREATE TABLE语句:

hive>   CREATE EXTERNAL TABLE userline(line STRING) ROW FORMAT
              DELIMITED FIELDS TERMINATED BY ','
              LINES TERMINATED BY '\n' 
              STORED AS TEXTFILE
              LOCATION '/home/admin/userdata';

如果没有这些,Hive将从HDFS获取您的数据并将其加载到/user/hive/warehouse(如果删除该表,则数据也将被删除)。