我是 Hadoop 的新手,想知道 Hadoop-common , Hadoop-core 和之间的区别Hadoop的客户端
顺便说一句,对于给定的类,我如何知道 Maven 中哪个工件包含它?例如,哪一个包含 org.apache.hadoop.io.Text ?
答案 0 :(得分:9)
从高层角度帮助提供有关Hadoop-common,Hadoop-core和Hadoop-client之间差异的一些其他详细信息:
一般来说,对于构建提交给YARN的应用程序的开发人员,运行MR作业,或者从HDFS访问文件使用Hadoop客户端库。
答案 1 :(得分:1)
为了构建Hadoop map-reduce应用程序,您只需要hadoop客户端依赖项。 (使用新的API)。像hadoop-hdfs,hadoop-common,hadoop-clientapp,hadoop-yarn-api这样的依赖关系就此解决了。
答案 2 :(得分:0)
来自techopedia
Hadoop Common
指的是支持其他Hadoop模块的常用实用程序和库的集合。它是Apache Hadoop Framework的重要组成部分或模块,以及Hadoop分布式文件系统(HDFS),Hadoop YARN和Hadoop MapReduce。
与所有其他模块一样,Hadoop Common
假设硬件故障很常见,并且这些故障应由Hadoop框架自动在软件中处理。
Hadoop Common
也称为Hadoop Core
。
Hadoop Client libraries
有助于将数据加载到集群中,提交描述应如何处理数据的Map Reduce作业,然后在完成作业时检索或查看作业的结果。看看这个article
此Apache链接提供Hadoop客户端库的依赖项列表。