我有一个有日期的数据集(2015年1月10日,1/10 / 2016,1 / 10/2017)。我想改变它的格式(2015年,2016年,2017年)。我需要使用Hadoop来做到这一点。
答案 0 :(得分:0)
使用正则表达式提取所需的值。
可以在此博客中找到包含示例的优秀教程:Extract date in required formats from hive tables
如果您只想要年份和月份格式'yyyy-MM',请使用
regexp_extract(column_datetime,'(.*\-.*)\-.*',1)
编辑:最初^这个^是作为评论发布的,但我把它作为答案包装,所以其他人可能会发现它更快。
答案 1 :(得分:0)
另一种方式
select regexp_replace('1/10/2015, 1/10/2016, 1/10/2017','(\\d/\\d\\d/)','') rr