由于节点太多,Hadoop性能问题?

时间:2018-04-24 14:58:55

标签: performance hadoop bigdata

我听说如果你运行广泛的查询,hadoop会遇到性能问题,因为可能涉及的节点太多了吗?

任何人都可以验证或伪造此声明吗?

谢谢! BR

1 个答案:

答案 0 :(得分:0)

如果添加太多文件,namenode会出现性能问题,因为它必须将所有文件位置存储在内存中。您可以通过定期创建更大的存档来优化此功能。例如,每日数据库转储变为仍处于可处理格式的月/年压缩存档

HDFS数据节点只是一个文件系统,可以线性扩展。总体上添加更多NodeManager节点没有负面影响,并且据报道YARN运行多达1000个节点,如果您确实需要更多节点,我建议使用独立群集。

与任何分布式系统一样,您需要优化网络交换和系统监控,但这些是Hadoop不具备的运营性能问题