我正在使用Airflow连接从RDS SQL实例中提取和处理数据。问题是该进程生成了超过21个连接(虽然我的并发在cfg文件中设置为4)并且RAM正在重载。根据我如何设置过程,我不希望一次有超过6到8个连接。是否有一个好的cfg文件设置或管理面板选项,可以让我控制这种行为?我尝试过更新sql_alchemy_pool_recycle
,但这并没有解决问题。
随着连接数量的增加以及RDS实例上的RAM饱和,您可以看到系统性能在gant图表上开始减少的位置:
答案 0 :(得分:0)
在气流中,您可以通过POOL限制重度并发内容,您可以设置池大小,操作员不会超出池大小。 https://airflow.incubator.apache.org/concepts.html#pools