应用错误收集

我将尝试部分回答：

如果您只从hadoop群集或HDFS检索信息它类似于linux中的Cat命令，意味着只读取数据不处理。
如果您想要一些计算，如SUM，AVG或任何其他聚合在数据之上的函数然后是REDUCE的概念，因此Map reduce就会出现。
所以当您的数据是巨大的时候，hadoop是有用的或值得的计算也。我认为他们没有性能优势在HDFS中读取少量数据而不是读取大量数据 HDFS中的数据（只是想想你将数据存储在RDBMS中）定期，你只能每天查询select *语句，但是，当您的数据以指数方式增长并且您想要这样做时计算您的RDBMS查询需要时间来执行。
要使Map减少在大型数据集上高效工作，您需要拥有大量的节点和计算能力，具体取决于你的用例。