LOAD DATA INPATH表文件以Impala中的某些字符串开头

时间:2018-12-05 10:20:03

标签: sql hive impala

一个简单的问题,我是Impala的新手。

我想使用impala将数据从HDFS加载到我的datalake。

所以我有一个csv this_is_my_data.csv,我想做的就是在不指定所有扩展名的情况下加载文件,我的意思是这样的:

LOAD DATA INPATH 'user/myuser/this_is.* INTO TABLE my_table

这是一个以this_is开头的字符串,后面跟着任何内容。

如果您需要其他信息,请告诉我。预先感谢。

1 个答案:

答案 0 :(得分:0)

documentation说:

  

您可以指定要移动的单个文件的HDFS路径,也可以指定   目录的HDFS路径,用于移动该目录中的所有文件。   您不能指定任何通配符来仅接收某些文件   从目录。

解决方法是使用mvcp命令将文件放入表目录。使用DESCRIBE FORMATTED命令检查您的表目录,然后运行mvcp命令(在外壳程序中,当然不是在Impala中):

hdfs dfs -mv "user/myuser/this_is.*" "/user/cloudera/mytabledir"

或者先将需要加载的文件放入某个目录,然后再加载所有目录。