我有以下按年份分组的数据关系。
DESCRIBE YEARDATA输出是:
YEARDATA: {timestamp: chararray,year: chararray,month: chararray,day: chararray,hour: chararray,minutes: chararray,seconds: chararray}
我想将这些数据存储在基于年/月/日的分区中。
如何使用PIG编写以下逻辑?
FOREACH YEARDATA {
--- GENERATE HDFS URL using UDF generateUrl(year, month, day)
---- STORE YEARDATA INTO url USING PigStore(,);
};
请建议。