基于火花流的JavaDStream中的时间戳汇总数据

时间:2016-12-01 05:15:15

标签: java spark-streaming

我正在java中编写一个spark流式传输作业,它从kafka获取输入记录。 现在,该记录在JavaDstream中可用作自定义Java对象。 样本记录是:

TimeSeriesData:{tenant_id='581dd636b5e2ca009328b42b', asset_id='5820870be4b082f136653884', bucket='2016', parameter_id='58218d81e4b082f13665388b', timestamp=Mon Aug 22 14:50:01 IST 2016, window=null, value='11.30168'}

现在我想根据字段“timestamp”的分钟,小时,日和星期汇总这些数据。

我的问题是,如何基于窗口聚合JavaDstream记录。示例代码会很有用。

0 个答案:

没有答案