用给定值替换hive表的列中的所有值

时间:2015-11-03 16:53:47

标签: hadoop hive

我有一个带有架构的hive表 -

customer_id string
country string
start_date string
end_date string

我想用end_date列中的给定字符串替换所有值,该字符串为yyyy-mm-dd格式,但存储为字符串。

看看hive函数,我发现了其中两个 - regexp_replace和translate。请参阅 - Hive wiki

1 个答案:

答案 0 :(得分:1)

@bunny:您将无法使用提到的UDF更新现有列。如果要更新列,则必须使用UPDATE(假设您有hive> = 0.14并且表格是依次创建的 - fileformat-clustering-bucketing)。我确定你不是在寻找这种方法!

提到的udfs(regexp_replace和translate)都用于获取所需的输出,但不能替换现有的数据。

我看到的唯一选项是使用更新的列覆盖整个表