在ETL中使用AWS Glue服务的最佳用例是什么,它有Python包支持的限制?
根据AWS Glue文档:
只能使用纯Python库。依赖C的图书馆 扩展,例如pandas Python数据分析库,不是 但支持。
我尝试了一些ETL作业,使用AWS Glue运行,我将一些库(如Pandas,Holidays等)打包为一个单独的zip文件并尝试过,但由于这些库导致作业失败(ImportError:Pandas) ?
AWS在不久的将来没有为这些库提供支持的任何ETA?
或者,使用AWS Glue是否为时尚早,因为python库的限制现在是一个主要障碍?