操作r hadoop

时间:2016-03-02 16:24:20

标签: rhadoop

我有一个有日期的数据集(2015年1月10日,1/10 / 2016,1 / 10/2017)。我想改变它的格式(2015年,2016年,2017年)。我需要使用Hadoop来做到这一点。

2 个答案:

答案 0 :(得分:0)

使用正则表达式提取所需的值。

可以在此博客中找到包含示例的优秀教程:Extract date in required formats from hive tables

  

如果您只想要年份和月份格式'yyyy-MM',请使用   regexp_extract(column_datetime,'(.*\-.*)\-.*',1)

编辑:最初^这个^是作为评论发布的,但我把它作为答案包装,所以其他人可能会发现它更快。

答案 1 :(得分:0)

另一种方式

select regexp_replace('1/10/2015, 1/10/2016, 1/10/2017','(\\d/\\d\\d/)','') rr