标签: google-cloud-dataflow apache-beam google-cloud-pubsub
如果在发布时或读取时未分配timestamp属性,那么将哪个时间戳用于窗口? Documentation指出,第一次系统会看到每条记录。该系统是数据流拓扑还是Pub / Sub?
如果未提供timestampAttribute,则系统将生成记录 第一次看到每条记录的时间戳。所有窗口将是 相对于这些时间戳而言。
答案 0 :(得分:1)
未指定时间戳属性时分配给消息的时间戳是在pubsub消息上设置的“ publishTime”。
请参阅:https://github.com/apache/beam/blob/50d0760faf01bdcdea988157a6b732bb448ba4b8/sdks/java/io/google-cloud-platform/src/main/java/org/apache/beam/sdk/io/gcp/pubsub/PubsubJsonClient.java#L178