标签: hadoop mapreduce hdfs reduce distributed-cache
无论如何,map reduce框架中的节点之间有很多文件传输。 那么如何使用分布式缓存来提高性能。
答案 0 :(得分:0)
DistributedCache是Map-Reduce框架提供的一种工具,用于缓存应用程序所需的文件。为作业缓存文件后,hadoop框架将使映射/缩减任务正在运行的每个数据节点(在文件系统中,而不是在内存中)可用。文件通过网络传输,通常通过HDFS传输。与使用HDFS进行非数据本地任务相比,它不会对网络造成压力。
答案 1 :(得分:0)