更改配置单元中的表(插入新数据)时,此记录插入新数据的时间

时间:2019-05-10 22:16:33

标签: apache-spark hive

Hive表示例:

id|year
1|1990

为同一张表添加了新数据:

id|year
2|2010

但是我需要使用新列插入时间,例如:

id|year|updateddate
1|1990|olddatatimestamp
2|2010|updateddatatimestamp

蜂巢有可能吗?甚至还想知道它在火花标度中的效果如何(特别是对于DF / RDD)。

谢谢

1 个答案:

答案 0 :(得分:1)

Hive中没有自动计算的列,请使用current_timestamp显式插入时间戳。当然,您需要添加updateddate列:

insert into table tablename
select 2 as ID, 2010 as year, current_timestamp as updateddate;