有人可以根据软件背后的想法解释什么是hadoop?是什么让它如此受欢迎和/或强大?
答案 0 :(得分:5)
Hadoop是一种编程环境,可以在大型机器集群上并行运行大量计算。它具有多个机器丢失的弹性,可扩展以通过添加机器和跟踪报告计算状态来实现更快的计算。 Hadoop之所以受欢迎是因为它是一个强大的开源环境,并且因为许多用户(包括Yahoo!,Microsoft和Facebook等大型用户)将其用于大型数据处理项目。 它功能强大,因为它使用map / reduce算法,该算法将计算分解为两个简单操作的序列:
答案 1 :(得分:4)
Hadoop实施了Google的MapReduce算法,为了更好地了解它必须在http://research.google.com/archive/mapreduce.html
上阅读Google的MapReduce论文