在Cloud Dataflow Logging UI中,我看到了4个不同的日志
每个日志代表什么?
这是一个显示我的意思的屏幕截图。
答案 0 :(得分:2)
dataflow-harness 和 dataflow-harness-stdout 是java worker harness生成的日志。工作人员完成大部分工作(例如将ParDo应用于数据)。
选择 dataflow-harness 将显示java worker harness记录的所有消息。
我们还获取了java worker harness的stdout / stderr,这些日志显示在 dataflow-harness-stdout 下。我们这样做是为了捕获Java记录器可能无法捕获的任何信息,例如JVM崩溃时的堆栈转储。
dataflow-worker-starter 记录与启动java worker harness相关的消息。启动过程基本上包括从GCS下载作业的jar,然后启动java worker harness。因此,如果在启动java worker harness时出现问题,这也是个好看的地方。
最后在 shuffle 下,您将找到来自洗牌机的日志。