标签: python amazon-web-services apache-spark pyspark aws-glue
我已经设置了Python来使用AWS Glue dev端点进行ETL编程。
我希望创建一个函数,可以找到该表中具有相同变量名的所有其他表 - 即一个函数,列出表名自动及其中的列。
基本上希望在pandas中使用带有数据帧的列来做你能做的事情。例如:就像我可以在pandas中执行以下操作
columns = df.columns
我希望做的事情相当于:
dbs = awsGlue.databases tables_db1 = dbs[0].tables