将数据从远程服务器加载到配置单元

时间:2016-11-23 07:39:34

标签: hadoop hive load hdfs impala

Hive loading:

如何使用以下命令从外部服务器或远程计算机将数据加载到hive表。通常,以下语句将从hadoop本地边缘节点开始工作。

将本地路径'本地文件系统'中的数据加载到表hive_table

1 个答案:

答案 0 :(得分:0)

内部Hive处理HDFS中存在的模式,在HDFS中创建一个位置,然后将所有数据移动到该HDFS位置。

现在创建一个Hive表,它将读取/指向该位置。

如果是Cloudera / HortonWorks这样的商业发行版,那么 Apache Hue 就是你的救世主。

如果它不是商业发行版,请使用scp协议创建hdfs文件,然后使用下面提到的Hive语法:

hive> CREATE  TABLE `remote_file`(
    >   `Temperature` int, 
    >   `Year` string)
    > ROW FORMAT DELIMITED 
    >   FIELDS TERMINATED BY ',' 
    >   LINES TERMINATED BY '\n' 
    > LOCATION
    >   'hdfs:///tmp/remote_file';