当我们从HDFS将数据加载到Hive表时,它会从源目录(HDFS)中删除文件

时间:2019-08-01 08:54:16

标签: hive hdfs

当我们从HDFS将数据加载到Hive表时,它会从源目录(HDFS)中删除文件,这样我们就可以将文件保留在源目录中,并将数据也加载到Hive表中。

我使用以下查询;

LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;

1 个答案:

答案 0 :(得分:0)

Hive在将数据加载到表中时不进行任何转换。 Load operations当前是纯复制/移动操作,可将数据文件移动到与Hive表相对应的位置。

使用hadoop fs cphdfs dfs cp命令复制(而不移动)文件:

hadoop fs -cp [source_file_path] [table_location_path]

hdfs  dfs cp [source_file_path] [table_location_path]

使用decribe formatted tablename命令检查表的位置路径。