在学习分布式存储系统时,我遇到了一个基本问题:结构化的非结构化和半结构化数据及其差异。我已经知道它们之间的简单差异,我想知道的是如何区别他们在里面。
答案 0 :(得分:0)
结构化数据是类似SQL的结构,其中字段(列)的数量是固定的,并且集合(表)中的每个条目具有相同的结构。对其他集合/表的引用是通过外键“硬连线”。
非结构化数据类似于MongoDB,其中集合是文档的松散关联,不需要具有相同的结构。每个文档可以具有不同的元素,并且对其他文档的引用可以是临时的。
半结构化系统是两者的各种混合体。例如,Google的Firebase存储库中的每个文档都必须具有相同的元素;然而,关系是临时的。半结构化数据通常包括继承和isA与hasA关系等语义。