从具有多个条目的表中选择随机值以插入到Hive中的另一个表中

时间:2019-01-30 16:32:19

标签: select random hive

enter image description here

我需要从上表中选择一个有多个值的随机值(例如:3333,4444,6666的-)。目前,我正在使用下面的代码,该代码会影响最终结果。

insert into com_n3
select distinct number,min(district)
from com_n2

结果将给出更多值为“ A”的数字作为分区。我需要一种从多个条目中进行选择的无偏随机方法。

1 个答案:

答案 0 :(得分:0)

您可以使用以下查询获得一些随机记录。

select number, district 
from 
    (
        select *,  row_number() over (partition by number order rand()) as rank 
        from 
            temp.com_n2
    ) a  
where a.rank=1