我想了解更多关于如何将NoSQL数据库集成到以关系模型为中心的架构(根据Data Vault 2.0标准构建)的更多信息。有没有人知道我可以在哪里教育自己这个主题。目前这不是Dan Lindstedt的最新着作!
答案 0 :(得分:2)
我假设“如何集成NoSQL数据库”,您指的是如何使用NoSQL数据源作为关系型DV2.0模型的输入。简而言之,您只需要将数据摄取到关系数据库中,并根据您的业务实体(集线器),其属性(卫星)及其关系(链接和卫星)将数据转换为所需的DV结构。这也假设您在NoSQL数据库中拥有的任何非结构化数据超出范围,或者可以存储在关系引擎的BLOB,XML或JSON存储中。
如果您指的是建模并存储在NoSQL数据库中的DV2.0,那么您是对的,这不在Dan的新书中。虽然DV2.0标准应该很容易应用于像Hive,Cloudera和Cassandra这样的东西。哈希使得可以将每个实体完全与另一个实体分开加载,复杂值(非结构化或半结构化数据)可以作为属性存储在卫星上。如何比较下一次加载的值取决于数据。也许,在进行比较时,将一个SHA1哈希与非结构化数据一起存储的过程将非常有用。
祝你好运,让我知道你是怎么过的。