我有一个主要用例,我想拥有一个使用Postgres的事务性关系数据库。
我还需要对数据进行频繁的汇总查询(计数,总和,平均值)。无法统计这些统计信息,因为我们必须提供多个搜索过滤器。
我最初考虑将Redshift用作辅助存储,可以为这些查询提供服务,但是随后,我还需要构建一个系统,以使两个存储之间的数据保持同步。
有没有更好的方法来实现这一目标?
答案 0 :(得分:1)
看看AWS DMS,您可以对其进行设置以在Redshift上保持Postgres数据的近实时复制。
这是可靠的并且需要最少的维护(例如,如果在源数据中添加新列)。
仔细阅读这两个方面,尤其是限制和要求。
https://docs.aws.amazon.com/dms/latest/userguide/CHAP_Source.PostgreSQL.html 和 https://docs.aws.amazon.com/dms/latest/userguide/CHAP_Target.Redshift.html
除非您需要它们,否则我建议从同步中排除文本(和其他大对象)列。可以通过设置标志轻松完成此操作,也可以逐列定制。
Postgres源数据库不必保留在AWS上。