我正在Azure Kubernetes服务(AKS)上运行Airflow。我使用此仓库中的脚本进行设置:https://github.com/EamonKeane/airflow-GKE-k8sExecutor-helm
我正在运行示例KubernetesPodOperator DAG,它成功运行了一段时间(大约2天)。但是,DAG中的第一个任务(run_this_first
)最终陷入了“排队”状态。
这是`kubectl日志[SCHEDULER_POD_NAME]的日志输出:https://www.pastiebin.com/5cef30d912dee
有什么想法为什么会这样?调度程序窗格仍处于运行状态。我可以手动重新启动调度程序窗格,以使DAG中的任务再次运行,但这不是一个长期解决方案。