数据库术语之间的差异

时间:2017-04-20 02:39:05

标签: database database-design mapreduce distributed-computing

我刚刚完成了一个数据库课程,我们深入研究了数据库的内部。我试图连接我们在课程中学到的所有术语的点,但我感觉我错过了一些作品。这就是我所知道的:

  • 数据库:数据结构的“逻辑”表示 - 可互换地用于表示物理数据,关系情况下的“表格”数据等,以及DBMS。
  • 数据库管理系统(DBMS):为管理员/用户提供开发加速访问等机制的工具。系统可以了解数据的统计信息,并可以执行查询优化以开发良好的执行路径。例如:PostgreSql,MySQL,MongoDB。我想很多人会混淆DBMS和数据库是一回事吗?
  • 数据存储在磁盘上。此数据不由文件系统管理,但DBMS执行与I / O相关的系统调用?
  • map / reduce等框架用于分布式数据库,因为它们提供了任务的“并行化”,因为我可以拥有许多映射器,框架抽象系统细节,如可扩展性,负载平衡等。如果map /我很困惑reduce仅适用于HDFS,HBase等。
  • 最终所有数据都存储在磁盘上,而DBMS是编写此数据的主要策略和结构。

我需要澄清和指导我的理解,我想连接点。

1 个答案:

答案 0 :(得分:1)

  1. 概念,逻辑和物理模型被广泛误解。在我看来:

    • 概念建模是根据业务领域完成的,例如:客户,员工,发票等。我们使用此级别来分析业务需求并与利益相关者进行沟通。我使用陈式ER图进行概念数据建模。概念模型在实施模型方面是中立的。

    • 逻辑建模是关于形式逻辑,关系理论和一致性。我们的重点是域,关系,依赖,规范化,冗余等。关系图可用,但我主要使用纯文本。

    • 物理建模是关于如何在DBMS或物理系统中实现逻辑模型。如果我的目标是SQL DBMS,我的物理模型将包含表,数据类型,外键约束等。物理模型可以使用任何特定于DBMS的功能,例如某些特殊类型的索引或放置规则。

  2. 数据库管理系统提供并管理对数据的所有访问,它们不仅仅是优化查询。它们管理结构,存储,检索,完整性,优化,身份验证,授权等。如你所说,DBMS和数据库经常混为一谈。如果您对OOP感到满意,可以这样考虑:DBMS是我们传递消息的对象。数据库是封装状态。

  3. 有些DBMS构建在文件系统之上,有些DBMS完全绕过文件系统。有些甚至建立在其他DBMS之上。

  4. 数据不仅存储在磁盘上。实际上,这个概念与存储无关。 “数据”是“基准”的复数形式,是“给定的东西”的拉丁词。数据首先在统计表的上下文中输入英语。数学上,数据是关联 - 域中的一组值,包含值的变量,集合之间的关系等。在计算机系统中,数据通常是指编码值,可以在函数和进程之间存储或传递。 / p>

  5. Map / reduce不仅限于分布式数据库,而是将其视为可分发的数据处理。它可以与集中式或分布式数据库一起使用虽然一些系统基于或实现map / reduce技术,但它不限于那些系统。图书馆有多种语言版本,任何具备所需知识的人都可以使用该技术。

  6. 我希望这会有所帮助。如果您需要进一步澄清,请与我们联系。