Hive中的分区和分段

时间:2017-04-06 03:10:21

标签: hadoop hive hiveql hadoop-partitioning

我的hive表将有通话记录数据。 该表的3列是field1-CALL_DATE,field2-FROM_PHONE_NUM,field3-TO_PHONE

我会查询类似的东西 1)我想获得特定日期之间的所有通话记录。 2)我想在某些日期之间获取FROM_PHONE电话号码的所有通话记录。 2)我想获得某些日期之间的TO_PHONE电话号码的所有通话记录。

我的桌子大小约为6TB。

我可以知道如何应用分区或分组来提高所有查询的效果吗?

1 个答案:

答案 0 :(得分:0)

您的要求始终是在某些日期之间获取数据并对其进行过滤,因此表分区的日期偏差。

如何为动态分区创建Link

您可以将分区键日期设为yyyymmdd。

(如 - 20170406今天(2017年4月6日))