Java Segment大数组数据

时间:2014-12-10 14:14:01

标签: java

我有以下格式的大量数据

      TIME STAMP    Sum of T2I Obj
      11/17/2014 00:02:13 a 0.524
      11/17/2014 00:05:49 a 2.104
      11/17/2014 00:09:06 a 3.245
      11/17/2014 00:14:25 a 13.427
      11/17/2014 00:15:36 a 2.832
      11/17/2014 00:17:13 a 3.098
      11/17/2014 00:20:49 a 0.751
      11/17/2014 00:24:16 a 0.884

完整输入:

https://docs.google.com/spreadsheets/d/168ejowAajGfXv-JBQKm7u3_G8-oPM8Mfn1TC-3MzXsA/edit?usp=sharing

已处理的文件输出:(请参阅最后一页输出一小时,需要将其更改为八小时)

我的完整代码尝试:

https://drive.google.com/file/d/0BzTX2wIhk3Wza1lGVmhHcFZQX0k/view?usp=sharing

正如您所看到的,上面的文件在一列中有日期时间,在其他列中有值。

我想将所有单个数据分段为组合数据,持续8小时。

  TIME STAMP      Average
  11/17/2014 08    0.524 (AVG of all the data between 00hr -8hr)
  11/17/2014 16    2.104 (AVG of all the data between 08hr -16hr)
  11/17/2014 24    3.245 (AVG of all the data between 16hr -24hr)

来自Java专家的任何帮助!!

1 个答案:

答案 0 :(得分:0)

您在这里尝试做的是一个ETL过程。最好使用一些类似于kettle的框架。如果您有分布式数据,那么更好地使用hadoop mapreduce工作会有所帮助。