一个简单的问题,我是Impala的新手。
我想使用impala将数据从HDFS加载到我的datalake。
所以我有一个csv this_is_my_data.csv
,我想做的就是在不指定所有扩展名的情况下加载文件,我的意思是这样的:
LOAD DATA INPATH 'user/myuser/this_is.* INTO TABLE my_table
这是一个以this_is
开头的字符串,后面跟着任何内容。
如果您需要其他信息,请告诉我。预先感谢。
答案 0 :(得分:0)
您可以指定要移动的单个文件的HDFS路径,也可以指定 目录的HDFS路径,用于移动该目录中的所有文件。 您不能指定任何通配符来仅接收某些文件 从目录。
解决方法是使用mv
或cp
命令将文件放入表目录。使用DESCRIBE FORMATTED命令检查您的表目录,然后运行mv
或cp
命令(在外壳程序中,当然不是在Impala中):
hdfs dfs -mv "user/myuser/this_is.*" "/user/cloudera/mytabledir"
或者先将需要加载的文件放入某个目录,然后再加载所有目录。