我的hive表将有通话记录数据。 该表的3列是field1-CALL_DATE,field2-FROM_PHONE_NUM,field3-TO_PHONE
我会查询类似的东西 1)我想获得特定日期之间的所有通话记录。 2)我想在某些日期之间获取FROM_PHONE电话号码的所有通话记录。 2)我想获得某些日期之间的TO_PHONE电话号码的所有通话记录。
我的桌子大小约为6TB。
我可以知道如何应用分区或分组来提高所有查询的效果吗?
答案 0 :(得分:0)
您的要求始终是在某些日期之间获取数据并对其进行过滤,因此表分区的日期偏差。
如何为动态分区创建Link
您可以将分区键日期设为yyyymmdd。
(如 - 20170406今天(2017年4月6日))