使用配置单元将不同的时区转换为唯一的时区

时间:2014-08-05 18:01:19

标签: sql hadoop hive hiveql

我有这样的数据

'           date            |  Col 1
 ----------------------------------------
 2014-07-07 00:02:15.089-07 |   10
 2014-07-07 00:08:15.069-08 |   20
 2014-07-10 00:04:17.079-09 |   40
 2014-07-08 00:07:15.089-06 |   30

日期字符串末尾的07/08/09/06表示时区。我试图得到一个平均列。但首先我需要将所有不同的时区转换为唯一的时区。我需要将所有日期字符串转换为UTC,然后对不同的日期或小时进行col 1的平均值。我想过使用子串,但没有帮助。非常感谢任何帮助。非常感谢。

1 个答案:

答案 0 :(得分:0)

我认为您可以使用UDF(用户定义的函数)来实现此目的。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF