RDBMS VS MAP REDUCE

时间:2014-09-04 06:00:46

标签: hadoop mapreduce

我正在浏览Hadoop-权威指南,我遇到了这些问题:

  

规范化给MapReduce带来了问题,因为它使读取记录成为非本地操作,并且是其中一个核心假设   MapReduce使得它可以执行(高速)   流式读写。

有人可以解释这些行在外行语言中的实际含义吗?

我知道什么是规范化。如何使阅读记录成为非本地记录 操作?参考hadoop的非本地操作是什么意思?

1 个答案:

答案 0 :(得分:5)

在hadoop中,本地操作是指在存储需要使用的数据的同一物理位置执行代码。

当您对数据进行规范化时,您基本上将其拆分。如果这个"分开"数据分布在两个物理上不同的区域,你突然有非本地操作。