我遇到了我的delta加载项目的问题:)
上下文:我的基于Postgres的数据仓库每天都会从我基于Mysql的网店中提取数据。我们为此设置了一个只读的奴隶,我认为这是IT部门给予我的最大支持,即主人不会做任何事情来帮助我。
情况:我想把最近创建或更新的行从MySQL拉到Postgres。像每15-30分钟一样。因此,我的数据仓库中的延迟在流程结束时最多可达30分钟。 因此,在日期上使用简单条件对每张桌子进行快速循环就足够了。
问题:网店数据库相当大,处理每个表需要一段时间(每个表最多1分钟,日期没有编入索引,也没有分区),这会影响整个项目...
问题:我可以优化只读的mysql slave(主服务器上没有操作)吗?
非常感谢! 诉
干杯, 文森特
答案 0 :(得分:0)
对于感兴趣的人,这是我提出的解决方案:
我基本上在奴隶上添加了索引(不在主人身上)。问题解决了。 有趣的是,这可以通过Mysql DB实现,因为复制过程使用的是日志等。
干杯, 诉