我在S3和RDS中拥有数据,并且当前使用AWS Glue + Athena作为DW。
我的客户(超过500个)是:
- 内部客户:用于查询(SQL)数据和报告(因此Athena)
- 外部客户:用于查询(SQL)他们的数据,将数据仓库连接到BI产品(例如Tableau)以进行报告
问题:
- Redshift是更好的DW(相对于Athena / Glue)还是RDS?
- 如何设置数据库,使其适合外部客户访问DW的有限数据子集?
我的想法:
- Redshift更适合于并发SQL查询,可伸缩性,性能等,并且能够与最常见的BI资源集成。
- Redshift不利于限制访问权限/我还没有看到在 table 级别限制访问权限的明智方法。一种选择是将数据“复制”到新的架构中,但这意味着数据重复。在RDS(PostgreSQL)中,您可以创建数据视图并将其仅显示给特定客户端。如果有解决这个问题的聪明方法,我会很好奇吗?