我是Hadoop的新手,我有一个HR.csv文件导入hadoop,需要存储/保存在HDFS上我真的很困惑,当我需要保存在HDFS上的哪个文件夹和我的日食时只看到带有趣文件的DFS。
如果要将我的csv文件导入为 hadoop fs -put / source / dest 其中source是我的输入文件的名称,dest是存储在HDSF中的地方,如果在eclipse中运行我的Hadoop,我怎么写这个?
我的另一个问题来自我的数据文件我有9列,但我对两列感兴趣,“离开”一个人离开公司与否,但我应该只使用映射器和减速器给离开公司的员工另一栏是他们所在的部门,如果是销售或不是。
请协助导入数据的代码,只提取那两列,mapper和reducer代码。
感谢。