我有一个DAG,可以将数据从源导入服务器。从那里,我希望将该文件从服务器下载到Windows网络。我想将此部分保留在Airflow中以实现自动化。有人知道如何在Airflow中做到这一点吗?我不确定是否要使用os包,shutil包,或者是否有其他方法。
答案 0 :(得分:0)
我想您是说您正在寻找一种将文件从云服务器获取到Windows共享驱动器或Windows网络中计算机上的方法,这些是我见过的一些选择:
使用Airflow({shutil
)或bash脚本将文件传输到正确的目录以供其他进程拾取,或者通过调用bash子进程来使用Airflow,所有这些都应该可行通过SCP执行直接传输或通过git提交数据。您将必须找出防火墙和网络设置的可能。其中一些将需要在Windows端协调任务(例如git选项将需要某种cron作业或任务计划程序以拉出存储库以使文件保持最新状态)。