具有MPP架构的NoSQL或RDBMS,例如redshift或azure仓库,用于数据处理

时间:2018-11-03 08:02:13

标签: nosql amazon-dynamodb amazon-redshift rdbms

我有一个问题,我需要存储用户的地址数据,这些数据可能来自不同的供应商,格式不同。获得数据后,我需要进行一些清理和皱纹处理,然后运行重复数据删除过程以获取干净的结构化数据。一旦数据干净,我可能不得不基于一些尚未定义的复杂逻辑,从不同供应商那里选择地址的不同属性。我的问题是

1)我应使用哪个数据库,即NOSQL数据库家族(如document / keyvalue / dynamoDB等)或RDBMS与MPP数据库(如redshift或azure数据仓库)

2)像mongoDB这样的NOSQL DB提供了模式的灵活性,但是同时查询或重复数据删除过程并不是这些数据库的内置功能。

如果有人可以指导我,我会非常感激

谢谢 阿图尔

0 个答案:

没有答案