在AWS Glue中添加数据列

时间:2019-01-28 11:09:19

标签: aws-glue

我找不到合适的子社区,所以我希望我的问题适合这里。

我目前正在使用S3,Lambda,Redshift和Glue为AWS上的分析解决方案建立ETL管道。这样做时,我偶然发现了一个我认为很平常的用例,但我在Google上根本没有发现太多。

我的问题是,我已经从第三方来源提取数据了几个月,然后才发现我缺少几本很好的资料。在初始设置期间,只需重置所有内容并用新的数据表(包括粘合和Redshift形式)重新加载所有内容就没什么大问题了,但是这会花费大量的金钱。

在不创建全新表的情况下将数据列添加到Glue数据目录中现有数据表的好方法是什么?我可以使用现有行的空值(或NULL)进行管理。

非常感谢!

1 个答案:

答案 0 :(得分:0)

您可以使用以下两个选项之一将列添加到Glue数据目录中的现有表中

  1. 第一个选项是在胶水控制台上手动更改,转到数据库->表->单击表->编辑模式->添加列。更新后,您应该可以在表格中看到它。

  2. 如果您不想手动进行操作,则可以通过选择编程语言来使用Glue API call。例如Boto3 API call的python。