我有这样的数据
' date | Col 1
----------------------------------------
2014-07-07 00:02:15.089-07 | 10
2014-07-07 00:08:15.069-08 | 20
2014-07-10 00:04:17.079-09 | 40
2014-07-08 00:07:15.089-06 | 30
日期字符串末尾的07/08/09/06表示时区。我试图得到一个平均列。但首先我需要将所有不同的时区转换为唯一的时区。我需要将所有日期字符串转换为UTC,然后对不同的日期或小时进行col 1的平均值。我想过使用子串,但没有帮助。非常感谢任何帮助。非常感谢。
答案 0 :(得分:0)
我认为您可以使用UDF(用户定义的函数)来实现此目的。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF