我有一个带有架构的hive表 -
customer_id string
country string
start_date string
end_date string
我想用end_date列中的给定字符串替换所有值,该字符串为yyyy-mm-dd格式,但存储为字符串。
看看hive函数,我发现了其中两个 - regexp_replace和translate。请参阅 - Hive wiki
答案 0 :(得分:1)
@bunny:您将无法使用提到的UDF更新现有列。如果要更新列,则必须使用UPDATE(假设您有hive> = 0.14并且表格是依次创建的 - fileformat-clustering-bucketing)。我确定你不是在寻找这种方法!
提到的udfs(regexp_replace和translate)都用于获取所需的输出,但不能替换现有的数据。
我看到的唯一选项是使用更新的列覆盖整个表