根据客户帐户创建分区

时间:2018-08-06 05:22:56

标签: hadoop hive database-partitioning

我需要根据客户标识符(帐号如12345678)对大型Hive表进行分区。

特别是,我正在寻找一个获取customer_id的函数,然后将其转换为数字值(如0-9),使其成为我的分区。这样一来,我在每个分区中就有10%的客户。

  

例如,f('123455')返回4

赞赏提示

0 个答案:

没有答案