我有一个包含以下列的文件,要求我“根据提取日期进行分区”。 “提取日期”是文件中的一列。这是文件中的列:
现在,我已经将此文件包含在Unix目录中。
在这里我被要求做什么?
答案 0 :(得分:0)
分区是Hive中的一项功能,旨在针对表中的一组记录进行定位。
首先,您需要根据“提取日期”列创建一个分区表,如下所示:
create table <table_name>
(
name string,
location string
)
partitioned by (extract_date string)
stored as TEXTFILE;
这样做,将创建分区表。
现在,为了将文件中的数据加载到表中,再次有很多方法可以这样做,
使用静态分区机制加载
通过从其他表等中选择数据来使用动态分区进行加载。