标签: hadoop hive database-partitioning
我需要根据客户标识符(帐号如12345678)对大型Hive表进行分区。
特别是,我正在寻找一个获取customer_id的函数,然后将其转换为数字值(如0-9),使其成为我的分区。这样一来,我在每个分区中就有10%的客户。
例如,f('123455')返回4
赞赏提示