我的要求是将数据存储到S3中,并使用Amazon Redshift Spectrum对S3数据执行查询。我的数据是用一对多和多对多建模的。例如,考虑以下SQL模式
user (id, name)
user_phoes (id, phone_type, user_id)
user_roles (id, role_type, user_id)
user_role_activities (id, type, user_role_id)
我需要一种更好的方法来将此数据存储在S3中。这样我就可以通过Redshift Spectrum将它们轻松加载到Redshift中以执行JOIN查询。
注意:数据将按计划插入S3。并且Redshift应该保持与我的模型相同的外键约束。数据可以以任何顺序插入到S3中。那是user_phones数据先于user数据。
期望在Redshift中存储S3和计算数据的更好方法