我使用mysql,oracle等来自各地的数据源。每个数据源将日期存储为表中的记录,但格式不是标准格式,甚至可能因表格而异。相同的数据源(yyyy-MM-dd,yyyy-dd-MM,MM-dd-yyyy,yyyy-MMM-dd HH:mm:SS:ss等)。
有哪些选项可以标准化这些不同的日期字段以存储在配置单元中?猪?
答案 0 :(得分:0)
如果您使用Sqoop将数据提取到Hive,您可以编写自己的查询以获取特定标准格式的日期。
sqoop --options-file <Source RDMS options file>
--query "select to_char(start_date,'mm/dd/yyyy') as my_date from SALES"