我在8 + 1台机器的集群上使用apache storm拓扑。这些机器上的日期不一样,我们的差异可能超过5分钟。
preprod-storm-nimbus-01:
Thu Feb 25 16:20:30 GMT 2016
preprod-storm-supervisor-01:
Thu Feb 25 16:20:32 GMT 2016
preprod-storm-supervisor-02:
Thu Feb 25 16:20:32 GMT 2016
preprod-storm-supervisor-03:
Thu Feb 25 16:14:54 UTC 2016 <<-- this machine is very late :(
preprod-storm-supervisor-04:
Thu Feb 25 16:20:31 GMT 2016
preprod-storm-supervisor-05:
Thu Feb 25 16:20:17 GMT 2016
preprod-storm-supervisor-06:
Thu Feb 25 16:20:00 GMT 2016
preprod-storm-supervisor-07:
Thu Feb 25 16:20:31 GMT 2016
preprod-storm-supervisor-08:
Thu Feb 25 16:19:55 GMT 2016
preprod-storm-supervisor-09:
Thu Feb 25 16:20:30 GMT 2016
问题: 风暴拓扑是否受此非同步影响?
注意:我知道同步更好,但系统管理员不会在没有证明他们必须这样做的证明/原因的情况下这样做。他们真的必须这样做,“出于拓扑的缘故”:)?
由于
答案 0 :(得分:1)
这取决于您正在进行的计算...如果您执行基于时间的窗口操作,它可能会对您的结果产生影响。否则,没关系。
对于Storm作为执行引擎,它根本没有任何效果。