标签: hadoop mapreduce
我是Hadoop的新手,目前正在设计我的MapReduce应用程序。在我的场景中,我有一个csv文件。我希望平均csv文件中的每一行,以便为每一行创建一个单独的映射器。据我了解,TextInputFormat将自动拆分文件。我当然要理解,还会自动为每一行创建一个单独的映射器吗?如果没有,如何告诉Hadoop做我想做的事情?我是否必须实施自定义拆分器?谢谢!
答案 0 :(得分:0)
没关系。我想到了。我需要使用NLineInputFormat。