标签: hadoop apache-pig resampling bigdata
我有一个非常大的数据集,我正在处理Pig。
Pig
数据包含timestamp(直到第二个频率),我想以分钟频率聚合我的数据(计算每分钟观察的数量,平均那一分钟内的其他变量)。
timestamp
是否可以使用Pig执行此操作? 谢谢!
答案 0 :(得分:0)
您可以修改时间戳字段(生成YYYYmmddHHMMss到YYYYmmddHHMM等新字段),然后按时间戳分组并汇总数据。