我正在浏览Hadoop-权威指南,我遇到了这些问题:
规范化给MapReduce带来了问题,因为它使读取记录成为非本地操作,并且是其中一个核心假设 MapReduce使得它可以执行(高速) 流式读写。
有人可以解释这些行在外行语言中的实际含义吗?
我知道什么是规范化。如何使阅读记录成为非本地记录 操作?参考hadoop的非本地操作是什么意思?
答案 0 :(得分:5)
在hadoop中,本地操作是指在存储需要使用的数据的同一物理位置执行代码。
当您对数据进行规范化时,您基本上将其拆分。如果这个"分开"数据分布在两个物理上不同的区域,你突然有非本地操作。